Forklog 2024-04-01 13:02:26

DeepMind создала ИИ-модель для фактчекинга

DeepMind представила ИИ-модель SAFE, проверяющую факты в ответах LLM лучше людей. У всех больших языковых моделей есть одна общая проблема — достоверность сгенерированной информации. Чат-боты подвержены галлюцинациям, которые мешают им верно отвечать на вопросы. Из-за этого каждый результат необходимо проверять вручную, что значительно увеличивает время решения задачи. Исследователи из DeepMind создали ИИ-модель, автоматически указывающую на неточности. Система получила название Search-Augmented Factuality Evaluator (SAFE) — «Оценщик фактов с расширенным поиском». Разработчики создали LLM, которая сперва разделяет утверждения или факты в ответе чат-ботов. Затем она используют Google Search для поиска сайтов, верифицирующих утверждения, и производит сравнение. По словам исследователей, использование ИИ-модели обойдется в 20 раз дешевле, чем проверка фактов людьми. Поскольку объем генерируемой чат-ботами информации стремительно растет, наличие дешевого способа верификации будет востребовано. Для обучения команда использовала нейросеть для проверки 16 000 фактов, содержащихся в ответах 13 основных языковых моделей из четырех семейств (Gemini, GPT, Claude и PaLM-2). Они сравнили результаты с заключениями живых фактчекеров и обнаружили, что SAFE совпадает с ними в 72% случаев. При проверке разногласий между ИИ-моделью и людьми SAFE оказался прав в 76% случаев. On a quick read I can’t figure out much about the human subjects, but it looks like superhuman means better than an underpaid crowd worker, rather a true human fact checker? That makes the characterization misleading. (Like saying that 1985 chess software was superhuman).…— Gary Marcus (@GaryMarcus) March 28, 2024 По словам профессора Гэри Маркуса, не совсем корректно утверждать, что ИИ-модель справляется с задачей на «сверхчеловеческом уровне», поскольку неизвестен уровень квалификации людей, которые принимали участие в эксперименте. Команда DeepMind разместила код SAFE на GitHub. Напомним, в сентябре 2023 года соучредитель компании Мустафа Сулейман назвал интерактивных ботов, которые могут выполнять задачи за человека, следующим этапом развития ИИ.

Enim loetud uudised

The Top 3 Cloud Mining Sites for Easy Money i...
2024-06-26
Is MATIC Price Dead? Will Polygon Price Make...
2024-06-26
Congressman Proposes Bitcoin for Taxes
2024-06-26
Robert Kiyosaki Explains Bitcoin’s ‘Banana Zo...
2024-06-26
Solciety’s Trending ICO Could 100X in 24 Hour...
2024-06-26
Bitcoin DeFi Platform Alex Lab Hacked
2024-06-26
Robert Kiyosaki Decodes Bitcoin’s “Banana Zon...
2024-06-26
Bitcoin Market Analysis and Updates: Key Tren...
2024-06-26

Seotud uudised

Donor Gifts 8 BTC to Aid Julian Assange’s Journey...
26 Jun 2024
XRP Price Plunges Amid Bitcoin Volatility: Key Lev...
26 Jun 2024
Nubank Integrates Bitcoin Lightning Network
26 Jun 2024
Pepe Coin Whale Sparks Concerns With 1 Tln PEPE Tr...
26 Jun 2024
Ripple Faces Critical Price Levels
26 Jun 2024
SEC Chairman Gary Gensler Comments on Progress of...
26 Jun 2024

Loe lahtiütlusest : Kogu meie veebisaidi, hüperlingitud saitide, seotud rakenduste, foorumite, ajaveebide, sotsiaalmeediakontode ja muude platvormide ("Sait") siin esitatud sisu on mõeldud ainult teie üldiseks teabeks, mis on hangitud kolmandate isikute allikatest. Me ei anna meie sisu osas mingeid garantiisid, sealhulgas täpsust ja ajakohastust, kuid mitte ainult. Ükski meie poolt pakutava sisu osa ei kujuta endast finantsnõustamist, õigusnõustamist ega muud nõustamist, mis on mõeldud teie konkreetseks toetumiseks mis tahes eesmärgil. Mis tahes kasutamine või sõltuvus meie sisust on ainuüksi omal vastutusel ja omal äranägemisel. Enne nende kasutamist peate oma teadustööd läbi viima, analüüsima ja kontrollima oma sisu. Kauplemine on väga riskantne tegevus, mis võib põhjustada suuri kahjusid, palun konsulteerige enne oma otsuse langetamist oma finantsnõustajaga. Meie saidi sisu ei tohi olla pakkumine ega pakkumine