Forklog 2022-01-28 10:02:27

OpenAI создала менее токсичную версию GPT-3

ИИ-лаборатория OpenAI создала новую версию языковой модели GPT-3, которая производит меньше оскорбительных выражений, дезинформации и ошибок в целом, используя проблему контроля искусственного интеллекта. We've trained GPT-3 to be more aligned with what humans want: The new InstructGPT models are better at following human intent than a 100x larger model, while also improving safety and truthfulness. https://t.co/rKNpCDAMb2— OpenAI (@OpenAI) January 27, 2022 Для создания модели под названием InstructGPT исследователи задействовали обучение с подкреплением с обратной связью от человека. Для этого они наняли 40 экспертов, которые оценивали ответы GPT-3 на ряд заранее написанных запросов, таких как «Напишите историю о мудрой лягушке по имени Юлий» или «Напишите креативную рекламу следующего продукта для размещения на Facebook». Ответы, которые по мнению жюри больше соответствовали очевидному намерению составителя подсказки, получили высокие баллы. Оскорбительные, насильственные и прочие недопустимые результаты эксперты отметили как неуместные. Обратную связь от жюри разработчики использовали в качестве вознаграждения в алгоритме обучения с подкреплением, который тренировал InstructGPT сопоставлять ответы на подсказки. В OpenAI обнаружил, что пользователи предпочитают ответы InstructGPT GPT-3 более чем в 70% случаев. Исследователи также сравнили версии новой модели разного размера. Они выяснили, что ответы InstructGPT с 1,3 млрд параметров предпочитают больше, чем тексты GPT-3 со 175 млрд параметров. Это означает, что контроль над ИИ может быть простым способом улучшить языковые модели, а не просто увеличить их размер, считают в организации. «Это первый раз, когда проблема контроля искусственного интеллекта применяется к реальному продукту», — сказал один из руководителей группы контроля ИИ в OpenAI Ян Лейке. Однако, по словам исследователей, InstructGPT по-прежнему допускает простые ошибки, иногда выдавая неуместные или бессмысленные ответы. Например, если дать ей подсказку, содержащую ложь, она воспримет ее как истину. OpenAI сделала InstructGPT моделью по умолчанию для пользователей API. GPT-3 по-прежнему доступна, но в организации не рекомендуют ее использовать. Ранее OpenAI пыталась смягчить предвзятость и токсичность базовой модели. Несмотря на достигнутый прогресс, разработчики признали наличие ряда нераскрытых вопросов и общих проблем при адаптации GPT-3 к обществу. Напомним, в ноябре 2021 года OpenAI обучила языковую модель решать математические задачки. В сентябре исследователи лаборатории научили GPT-3 генерировать короткие выжимки из художественных книг. Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

La maggior parte ha letto le notizie

SHIB vs. PEPE vs. XYZ: Which Meme Coin Could...
2024-11-02
SHIB vs. PEPE vs. XYZ: Which Meme Coin Could...
2024-11-02
Cybro Positioned to Outperform AVAX and Polka...
2024-11-02
Cybro Positioned to Outperform AVAX and Polka...
2024-11-02
Solana-based GRASS Token Skyrockets 125% Afte...
2024-11-02
Solana-based GRASS Token Skyrockets 125% Afte...
2024-11-02
Fewer Bitcoin Moves From Vintage Wallets in O...
2024-11-02
Fewer Bitcoin Moves From Vintage Wallets in O...
2024-11-02

Notizie correlate

POPCAT Aims for 30% Rally, 1:4 Risk-Reward Opportu...
02 Nov 2024
POPCAT Aims for 30% Rally, 1:4 Risk-Reward Opportu...
02 Nov 2024
US Treasury Yield Curve Bear Steepens as 2024 Elec...
02 Nov 2024
US Treasury Yield Curve Bear Steepens as 2024 Elec...
02 Nov 2024
Doge2014 Prepares for Major Exchange Listings and...
02 Nov 2024
Doge2014 Prepares for Major Exchange Listings and...
02 Nov 2024

Leggi la dichiarazione di non responsabilità : Tutti i contenuti forniti nel nostro sito Web, i siti con collegamento ipertestuale, le applicazioni associate, i forum, i blog, gli account dei social media e altre piattaforme ("Sito") sono solo per le vostre informazioni generali, procurati da fonti di terze parti. Non rilasciamo alcuna garanzia di alcun tipo in relazione al nostro contenuto, incluso ma non limitato a accuratezza e aggiornamento. Nessuna parte del contenuto che forniamo costituisce consulenza finanziaria, consulenza legale o qualsiasi altra forma di consulenza intesa per la vostra specifica dipendenza per qualsiasi scopo. Qualsiasi uso o affidamento sui nostri contenuti è esclusivamente a proprio rischio e discrezione. Devi condurre la tua ricerca, rivedere, analizzare e verificare i nostri contenuti prima di fare affidamento su di essi. Il trading è un'attività altamente rischiosa che può portare a perdite importanti, pertanto si prega di consultare il proprio consulente finanziario prima di prendere qualsiasi decisione. Nessun contenuto sul nostro sito è pensato per essere una sollecitazione o un'offerta