Media Direction Group запускает инструмент оценки нейросетей для маркетинговых задач

MEDIA DIRECTION GROUP представила инструмент LLMeter для тестирования эффективности больших языковых моделей (LLM) в задачах маркетинга. Система оценивает, насколько различные нейросети справляются с практическими рабочими сценариями — от анализа данных до медиапланирования и проверки фактов. О новом инструменте рассказали в компании.

Разработчики отмечают, что рынок искусственного интеллекта (ИИ) развивается очень быстро, новые версии моделей появляются регулярно, а их возможности существенно различаются в зависимости от типа задачи. В этих условиях компаниям становится сложнее выбирать оптимальные ИИ-инструменты для конкретных бизнес-процессов.

LLMeter формирует более 150 тыс. запросов, основанных на реальных задачах маркетологов и рекламных агентств, и отправляет их в разные нейросети через API. Среди протестированных моделей — решения, лежащие в основе сервисов ChatGPT, Gemini и Perplexity, а также другие модели, включая семейство Claude. После обработки запросов система формирует рейтинг моделей по эффективности в конкретных типах задач.

Оценка качества ответов проводится по шести направлениям: отчетность и работа с KPI, анализ трендов и медиаметрик, медиапланирование, финансовая аналитика, задачи PR и SMM, а также компетентность в маркетинге и менеджменте. В результате каждая модель получает набор сильных и слабых сторон.

Первые тесты показали, что универсальной нейросети для всех задач не существует. Например, при задачах фактчекинга модель Claude Sonnet 4.5 показала заметно более высокий результат, чем Claude Haiku 4.5 — 84% против 28% соответственно. При этом наиболее сложным для большинства моделей оказался блок аналитики трендов: 11 из 12 протестированных нейросетей продемонстрировали низкие показатели.

Николай Муравьев, вице-президент Media Direction Group по развитию инновационных ИИ-решений:

Сейчас многие совершают одну и ту же ошибку: выбирают одну нейросеть и пытаются заставить ее делать всё — и креативы придумывать, и сложные медиасплиты считать. Это прямой путь к тому, чтобы наделать критических ошибок в бизнесе.

С помощью инструмента LLMeter Media Direction Group имеет возможность проводить и регулярно обновлять тестирование, которое позволяет применять исключительно релевантные нейросети на большом спектре рабочих задач.

Нам не важно, какая модель кажется «умнее» в теории. Нам важно, какая из них решит конкретную задачу клиента точнее и дешевле. Мы создали инструмент, который помогает понять, где алгоритму можно доверять на 100%, а где все еще требуется жесткий контроль со стороны человека.

В компании добавили, что полные результаты тестирования представят на ближайшем заседании комиссий по развитию ИИ АКАР и АРИР и разместят на ресурсах индустриальных ассоциаций. Кроме того, до публикации результаты могут быть предоставлены по запросу в Media Direction Group.

Источник

Теги

16.03.2026

20 Время чтения: 2 мин.

Читать следующую

Media Direction Group запускает инструмент оценки нейросетей для маркетинговых задач

Читать следующую

OpenAI добавила в Codex плагины для анализа данных, дизайна и других рабочих задач

Дзен переходит на ИИ-архитектуру «Кортекс»

Большинство потребителей сомневаются, что ИИ действует в их интересах во время шопинга

Reve выпустила Reve 2.0 — нейросеть создаёт и редактирует изображения в 4K

Ideogram открыла веса Ideogram 4, но без лицензии на коммерческое использование

Мартин Скорсезе стал консультантом ИИ-стартапа Black Forest Labs

Microsoft представила Scout — ИИ-агент для Microsoft 365 работает, который сам выполняет задачи

Яндекс выпустил бесплатный курс по защите от ИИ-мошенничества

Количество дипфейков в рунете выросло в пять раз

НИУ ВШЭ возглавил рейтинг российских вузов в области ИИ

OpenAI добавила в Codex плагины для анализа данных, дизайна и других рабочих задач

Дзен переходит на ИИ-архитектуру «Кортекс»

Большинство потребителей сомневаются, что ИИ действует в их интересах во время шопинга

Reve выпустила Reve 2.0 — нейросеть создаёт и редактирует изображения в 4K

Ideogram открыла веса Ideogram 4, но без лицензии на коммерческое использование

Мартин Скорсезе стал консультантом ИИ-стартапа Black Forest Labs

Microsoft представила Scout — ИИ-агент для Microsoft 365 работает, который сам выполняет задачи

Яндекс выпустил бесплатный курс по защите от ИИ-мошенничества

Количество дипфейков в рунете выросло в пять раз

НИУ ВШЭ возглавил рейтинг российских вузов в области ИИ

Добавить комментарий Отменить ответ

Путин поддержал инициативу о запрете вейпов в регионах на примере Нижегородской области

Французская сеть Carrefour покинет турецкий рынок

Для маркетплейсов могут ввести новый налог

Сеть книжных магазинов «Читай-город» открыла свой самый восточный магазин — в Петропавловске-Камчатском

«Лента» приостановила продажу некоторых кондитерских изделий

«Магнит Маркет» временно закрыл пункты выдачи в Воронеже и Липецке

В 2028 году выручка «Чижика» может составить 1 трлн рублей

Маркетологи ждут новых российских рекламных платформ в 2026 году. Опрос МТС AdTech

Продажи новых легковых автомобилей выросли в марте более чем на 30%

Розничный рынок Центральной Азии в 2025 году впервые превысит 100 млрд долларов США

Сеть «Четыре Лапы» займется развитием пет-френдли туризма в Ярославской области