ChartNet від MIT і IBM: відкритий ресурс для аналізу графіків ШІ

Дослідники з MIT та IBM розробили ChartNet — масштабний відкритий ресурс, призначений для навчання моделей генеративного штучного інтелекту інтерпретувати складні графіки. Цей прорив вирішує проблему обмеженої здатності сучасних vision-language models (VLMs) обробляти мультимодальні дані з фінансових та наукових звітів. Замість того, щоб покладатися на величезні комерційні моделі, ChartNet дозволяє меншим компаніям ефективно використовувати AI для аналізу бізнес-трендів. Це значно знижує бар'єр входу для малого бізнесу у сферу високотехнологічного аналізу даних.

#ChartNet #штучний інтелект #VLMs #аналіз даних #MIT #IBM

За даними News, дослідники з MIT та MIT-IBM Computing Research Lab створили ChartNet — комплексний набір даних, який значно покращує можливості vision-language models (VLMs) у сфері інтерпретації графіків. Хоча сучасні моделі можуть виконувати завдання природної мови та аналізу зображень, вони часто стикаються з труднощами при інтеграції візуальних, числових та лінгвістичних даних, що є критичним для фінансових та наукових звітів.

Вирішення проблеми: синтетичний підхід

Для подолання цього «вузького місця» як навчальних даних дослідники застосували новий метод генерації. ChartNet містить понад 1 мільйон різноманітних графіків, кожен з яких кодує необхідні візуальні, мовні та числові компоненти. Цей підхід дозволяє моделям не просто бачити зображення, а й розуміти інформацію, що в них представлена.

Переваги відкритих моделей

Використовуючи ChartNet для навчання серії open-source VLMs, дослідники продемонстрували значні результати. Ці менші моделі часто перевершують за якістю вилучення даних та узагальнення графіків комерційні аналоги, які є набагато більшими за обсягом. Це відкриття має прямий вплив на економіку: воно дає змогу невеликим фірмам з обмеженим бюджетом легше інтегрувати AI-інструменти у свій робочий процес.

ChartNet слугує «одною зупинкою» для розуміння графіків, охоплюючи широкий спектр завдань.
Набір даних вирішує проблему дефіциту високоякісних навчальних матеріалів, які раніше були головним бар'єром у розвитку VLMs.
Це сприяє розробці менших моделей, що не вимагають «нескінченної кількості обчислень».

«Ми розробили ChartNet як універсальний ресурс для розуміння графіків, який охоплює практично все, що може знадобитися AI-моделі та фахівцю, який її навчає», — за словами Jovana Kondic, аспірантки MIT та співавторки дослідження. Вона підкреслює важливість досягнення високої продуктивності за допомогою менших архітектур.

Прогноз для бізнесу

Як повідомляє News, аналіз графіків є критичним завданням у практично кожній галузі, особливо в фінансах. Якщо VLMs зможуть надійно витягувати з графіків інформацію про тренди та тенденції, це значно прискорить низку подальших робочих процесів. Таким чином, ChartNet не лише покращує наукові дослідження, але й трансформує бізнес-аналітику, роблячи її доступнішою для ширшого кола користувачів.

Контекст для України

Для українських розробників ChartNet відкриває значну можливість для R&D, оскільки надає доступ до високоякісного мультимодального датасету без необхідності його створювати з нуля. Це особливо актуально для фінансових стартапів та компаній у сфері FinTech, які потребують точного аналізу графіків ринкових даних. Доступність цього open-source ресурсу дозволяє українським фахівцям тестувати можливості VLMs на локальних кейсах без високих витрат на комерційні API. Це знижує технологічний бар'єр для впровадження складного AI у бізнес-процеси.

Вирішення проблеми: синтетичний підхід

Переваги відкритих моделей

Прогноз для бізнесу

Контекст для України

Свіжі новини у нашому Telegram