CCT - Crypto Currency Tracker logo CCT - Crypto Currency Tracker logo
Forklog 2024-03-29 08:53:31

Claude 3 Opus превзошла GPT-4 по оценкам пользователей

ИИ-модель Claude 3 Opus от компании Anthropic впервые превзошла GPT-4 на Chatbot Arena. The king is deadRIP GPT-4Claude opus #1 ELoHaiku beats GPT-4 0613 & Mistral largeThat’s insane for how cheap & fast it is https://t.co/XWmvTE6h75 pic.twitter.com/fAwzJScLTH— Nick Dobos (@NickADobos) March 26, 2024 «Король мертв. Покойся с миром GPT-4», — написал разработчик программного обеспечения Ник Добос. Chatbot Arena используется исследователями нейросетей для оценки возможностей чат-ботов. GPT-4 добавлен на платформу в мае 2023 года, его вариации занимали лидирующие позиции до 26 марта 2024 года пока не уступили Claude 3. Согласно данным арены, одна из небольших моделей Anthropic — Haiku также показывает хорошие результаты. «Впервые лучшие из доступных моделей представлены не OpenAI. Opus наиболее подходящая модель для сложных задач, а Haiku сочетает в себе баланс экономичности и эффективности», — сообщил исследователь ИИ Саймон Уиллисон. Chatbot Arena управляется организацией Large Model Systems Organization, которая занимается исследованиями в области открытых моделей. Она сотрудничает со студентами и преподавателями Университета Калифорнии в Беркли, Университета Калифорнии в Сан-Диего и Университета Карнеги-Меллон. Особенность платформы в отсутствии объективных критериев оценки. При посещении сайта пользователь видит поле для ввода данных и два окна с результатами работы необозначенных ИИ-моделей. Основная задача — решить, какой результат кажется лучшим, основываясь на личных предпочтениях. Благодаря такому подходу Chatbot Arena определяет лидеров и регулярно обновляет таблицу, отражая полученные результаты. Ранее компания Amazon увеличила объем инвестиций в Anthropic до $4 млрд. Напомним, в марте ИИ-стартап представил чат-бота Claude 3, оказавшегося самым быстрым и мощным среди всех конкурентов по результатам тестов компании.

阅读免责声明 : 此处提供的所有内容我们的网站,超链接网站,相关应用程序,论坛,博客,社交媒体帐户和其他平台(“网站”)仅供您提供一般信息,从第三方采购。 我们不对与我们的内容有任何形式的保证,包括但不限于准确性和更新性。 我们提供的内容中没有任何内容构成财务建议,法律建议或任何其他形式的建议,以满足您对任何目的的特定依赖。 任何使用或依赖我们的内容完全由您自行承担风险和自由裁量权。 在依赖它们之前,您应该进行自己的研究,审查,分析和验证我们的内容。 交易是一项高风险的活动,可能导致重大损失,因此请在做出任何决定之前咨询您的财务顾问。 我们网站上的任何内容均不构成招揽或要约