Новые модели GPT-4.1 от Openai могут обрабатывать миллион токенов и решать проблемы кодирования лучше, чем когда-либо

admin


Сегодня утром Openai выпустила новую семью моделей искусственного интеллекта, которая значительно улучшает способность кодирования, сокращая затраты, отвечая непосредственно на растущую конкуренцию на рынке ИИ предприятия.

Компания AI в Сан-Франциско представила три модели-GPT-4.1, GPT-4.1 Mini и Nano GPT-4.1-все это доступно сразу через его API. Новый состав работает лучше в задачах разработки программного обеспечения, более точно следует инструкциям и может обрабатывать до одного миллиона токенов контекста, что эквивалентно около 750 000 слов.

«GPT-4.1 предлагает исключительные результаты по более низкой цене»,-сказал Кевин Вейл, директор по продукту Openai, во время объявления в понедельник. «Эти модели лучше, чем GPT-4O практически во всех измерениях».

Возможно, наиболее важным для корпоративных клиентов является цены: GPT-4.1 будет стоить на 26% меньше, чем его предшественник, в то время как легкая версия Nano станет наиболее доступным предложением OpenAI всего 12 центов на миллион токенов.

Как улучшения GPT-4.1 целевые предприятия разработчиков разработчиков

В откровенном интервью VentureBeat Мишель Покрасс, проведенная после обучения в Openai, подчеркнула, что практические бизнес -приложения управляли процессом разработки.

«GPT-4.1 был обучен с одной целью: быть полезным для разработчиков»,-сказал Покрасс VentureBeat. «Мы обнаружили, что GPT-4.1 намного лучше следовать видам инструкций, которые предприятия используют на практике, что значительно облегчает развертывание готовых к производству приложений».

Этот акцент на реальной утилите отражается в результатах. На Swe-Bench Verified, который измеряет возможности разработки программного обеспечения, GPT-4.1 набрал 54,6%-значительное улучшение точек по сравнению с GPT-4O.

Для предприятий, разрабатывающих агенты искусственного интеллекта, которые работают независимо над сложными задачами, усовершенствования в обучении являются особенно ценными. На многооценке Scale GPT-4.1 набрал 38,3%, опередив GPT-4O на 10,5 процентных пункта.

Почему трехуровневые стратегии Openai ставит под сомнение конкурентов, таких как Google и Anpropic

Внедрение трех различных моделей в разных ценовых точках посвящена диверсификации рынка ИИ. Флагманский GPT-4.1 предназначен для сложных предприятий, в то время как MINI и NANO версии решают варианты использования, когда скорость и эффективность затрат являются приоритетами.

«Не все задачи нуждаются в максимальной интеллекте или лучших возможностях», — сказал Pokrass VentureBeat. «Нано станет моделью рабочей лошадки для таких вариантов использования, как автозаполнение, классификация, извлечение данных или что -либо еще, где скорость является главной проблемой».

Одновременно Openai объявил о планах по исключению предварительного просмотра GPT-4.5-ее крупнейшей и самой дорогой модели, выпущенной всего два месяца назад-с его API до 14 июля. Компания позиционировала GPT-4.1 в качестве более экономичной замены, которая обеспечивает «улучшенную или аналогичную производительность на многих ключевых возможностях с гораздо более низкой стоимостью и задержкой».

Этот шаг позволяет OpenAI восстанавливать вычислительные ресурсы, предоставляя разработчикам более эффективную альтернативу его самым дорогостоящим предложениям, которое было оценено в 75 долларов США за миллион входных токенов и 150 долларов за миллион токенов.

Результаты реального мира: как Thomson Reuters, Carlyle и Windsurf используют GPT-4.1

Несколько корпоративных клиентов, которые тестировали модели до запуска, сообщили о существенных улучшениях в своих конкретных областях.

Thomson Reuters увидел 17% улучшение точности многодокументного обзора при использовании GPT-4.1 с его юридическим помощником по искусственному интеллекту Cocounsel. Это улучшение особенно полезно для сложных юридических рабочих процессов, включающих длительные документы с нюансированными отношениями между предложениями.

Финансовая фирма Carlyle сообщила о 50% лучшей эффективности при извлечении гранулированных финансовых данных из плотных документов-важнейшей способности для анализа инвестиций и принятия решений.

Варун Мохан, генеральный директор поставщика инструментов кодирования Windsurf (ранее Codeium), общий подробный показатель производительности во время объявления.

«Мы обнаружили, что GPT-4.1 уменьшает количество раз, когда ему необходимо читать ненужные файлы на 40% по сравнению с другими ведущими моделями, а также изменяет ненужные файлы на 70% меньше»,-сказал Мохан. «Модель также на удивление меньше словеса… GPT-4.1 на 50% меньше словеса, чем другие ведущие модели».

Контекст на миллион-ток: что предприятия могут делать с более чем на 8 раз больше возможностей для обработки

Все три модели имеют контекстное окно в один миллион токенов-в восемь раз больше, чем предел 128 000 токенов GPT-4O. Эта расширенная емкость позволяет моделям обрабатывать несколько длинных документов или целых кодовых баз одновременно.

В демонстрации OpenAI показал, что GPT-4.1 анализирует файл журнала сервера НАСА на 450 000 с 1995 года, идентифицируя аномальную запись, скрывающуюся глубоко в данных. Эта возможность особенно ценна для задач, включающих большие наборы данных, такие как хранилища кода или корпоративные коллекции документов.

Тем не менее, OpenAI признает деградацию производительности с чрезвычайно большими входами. На своем внутреннем тесте OpenAI-MRCR точность снизилась с 84% с 8000 токенов до 50% с одним миллионом токенов.

Как ландшафт AI Enterprise смещается как Google, Anpropic и Openai конкурируют за разработчиков

Релиз выходит в качестве конкуренции в пространстве AI Enterprise AI. Google недавно запустил Gemini 2.5 Pro с сопоставимым контекстным окном на один миллион, в то время как Sonnet Antropic Claude 3.7 набрал поддержку с предприятиями, ищущими альтернативы для предложений OpenAI.

Китайский AI Startup Deepseek также недавно обновил свои модели, оказав дополнительное давление на Openai, чтобы сохранить свою лидерскую позицию.

«Было очень здорово видеть, как улучшения в длинном контекстном понимании привели к лучшей производительности в конкретных вертикалях, таких как юридический анализ и извлечение финансовых данных», — сказал Покрасс. «Мы обнаружили, что очень важно проверить наши модели за пределами академических показателей и убедиться, что они хорошо работают с предприятиями и разработчиками».

Что дальше: Openai акцент на практических инструментах искусственного интеллекта для предприятий и разработчиков

Выпустив эти модели специально через свой API, а не CHATGPT, OpenAI сигнализирует о своей приверженности разработчикам и корпоративным клиентам. Компания планирует постепенно включать функции от GPT-4.1 в CHATGPT с течением времени, но основное внимание остается на предоставлении надежных инструментов для предприятий, создающих специализированные приложения.

Чтобы поощрять дальнейшие исследования в области обработки с длинным контекстом, OpenAI выпускает два набора данных оценки: OpenAI-MRCR для тестирования многоуровневых способностей основной работы и граф-шалков для оценки сложных рассуждений между длинными документами.

Для лиц, принимающих решения предприятия, семья GPT-4.1 предлагает более практичный, экономически эффективный подход к внедрению искусственного интеллекта. Поскольку организации продолжают интегрировать ИИ в свою деятельность, эти улучшения в надежности, специфичности и эффективности могут ускорить принятие в разных отраслях, которые все еще взвешивают затраты на реализацию против потенциальных выгод.

В то время как конкуренты преследуют более крупные модели, стратегический поворот Openai с GPT-4.1 предполагает, что будущее ИИ может принадлежать к самым большим моделям, а к наиболее эффективным. Настоящий прорыв может быть не в критериях, а при привлечении ИИ предприятия в пределах досягаемости большего количества предприятий, чем когда-либо прежде.



Источник

Рекомендуем

Оставить комментарий