ИИ для программиста?

Germany.ru → Форумы → Программирование

48918 просмотров Перейти к просмотру всей ветки

17.08.24 11:39

Re: ИИ для программиста?

MrSanders коренной житель

в ответ AlexNek 16.08.24 21:33

We never train on your data or conversations.
А что это можно как то по другому понять? Именно что обещают.

Это снова гвозди от другой стены. Попробую ещё разок донести.

Дано: модель М, данные Д, используемые для тренировки модели, например код проекта, которые принадлежат фирме. Есть бот Б, который использует М. Он должен помогать кодерам фирмы, основываясь на коде фирмы из Д.

Проблема: доказать что бот Б не выдаст в ответ на какой-то вопрос определённые данные из Д. Данные из Д (перед тренировкой М) изъять нельзя, иначе бот не сможет отвечать на вопросы (типа "как описать правило повышающее риск если клиент курит").

Пример (для наглядности, так просто, конечно, не работает). Погромизд, работающий в проекте для клиента А, спрашивает: "а как описать логику подсчёта премий и коэффициентов рисков для страхования жизни" а бот радостно вываливает "например так: <полное содержимое файла для клиента Б>".

Проблема существует. Уже было что жыпыты отвечал на "правильно сформулированные" вопросы, например, известными ему личными данными. ОпенАИ било пяткой в грудь и кричало что щас пофиксим, уже почти даже совсем уже скоро! Никаких письменных гарантий не дают. И не смогут. Так что только тщательная подготовка данных, на которых будем тренировать модель. По известным мне оценкам, стоимость такой подготовки данных кроет экономию от применения помощника в несколько раз. А возможные потери, вызванные утечками из-за плохо подготовленных данных, превышают экономию на 2 порядка.

То что ты нашёл раньше не имеет отношения к проблеме.

A. No, if you send me your source code for analysis, it will remain private and only accessible to me during our conversation. OpenAI's privacy policy ensures that your data isn't shared with others. Once our session ends, I no longer have access to the code or the conversation, and your code is not stored or used for other purposes.

Это про "сессию" общения с жыпыты. Типа, сессию закончил, я всё забыл. Честна - честна. А нам забывать не надо. Надо натренировать на данных.

То что ты нашёл сейчас тоже не имеет никакого отношения к озвученной проблеме.

We never train on your data or conversations.

Опять про сессию жыпыты. Типа ты нам что-то рассказал, а мы на этом модель не тренируем. Честна-честна. Я уверен, что брешут. Максимум анонимизируют и тренируют.

Перейти на