Cегодня, в эпоху электронной революции, количество информации в Интернете растёт с молниеносной скоростью, и возможность автоматизировать её анализ могла бы быть очень полезна. Растёт и необходимость развития электронных библиотек. Новый шаг в этом направлении сделали специалисты Института искусственного интеллекта Аллена (AI2).
В ноябре программисты Института запустили новую поисковую систему Semantic Scholar (можно перевести как “Семантический учёный”). Он выполняет привычную для учёных роль архива научных данных и при этом может выдавать в ответ на запросы список публикаций по заданным ключевым фразам. Создатели отмечают, что этот ресурс обладает свойствами искусственного интеллекта, а потому значительно расширит возможности традиционных онлайн-библиотек.
Так, одной из выдающихся черт сайта Semantic Scholar, отличающих его от “собратьев”, является возможность семантического понимания данных. Это означает, что поисковый алгоритм может извлекать из статьи различные элементы, такие как ключевые слова и фразы, ссылки, цитаты и другую информацию, анализировать связи между элементами текста и оценивать значимость смысла фразы, выдавая пользователю наиболее точную и полезную информацию.
Поисковая система Semantic Scholar имеет сдержанный дизайн, традиционный для академических ресурсов. Помимо стандартных инструментов она оснащена новым для научных поисковиков окном поиска по ключевым словам и фразам (Key Phrase), встречающимся в текстах статьей. При клике на ключевую фразу на экран выводится список статей, в которых, согласно семантическому анализу, эта фраза играет ключевую роль. Орен Эциони (Oren Etzioni), главный исполнительный директор Института Аллена, считает, что новый сервис будет высоко оценён пользователями научных онлайн-библиотек за удобство и глубокое “понимание смысла” статей.
База данных Semantic Scholar уже содержит более трёх миллионов публикаций на тему компьютерных технологий, и пользоваться ей можно совершенно бесплатно. Читатель также имеет доступ к полной версии материалов с возможностью скачивания их в формате PDF. В течение года, как утверждают авторы проекта, база данных будет пополняться материалами других тематик.
Разработчики проекта уверены в успехе нового ресурса, несмотря на наличие у него крупных конкурентов. В частности, гиганта среди академических поисковиков Google Scholar, базы данных которого охватывают более 100 миллионов документов. Тем не менее он не совершенен. Питер Джаско (Péter Jacsó), учёный, занимающийся исследованиями технологий поисковых машин в Гавайском Университете в Маноа, проанализировал эффективность работы Google Scholar в 2009 году и обнаружил ряд ошибок в результатах поиска. Например, отмечает Джаско, система могла “не осмысленно” процитировать не релевантные запросу публикации, придать слову “Оглавление” смысл ключевой фразы или принять номер страницы документа за год выхода статьи.
Источник : ВЕСТИ.RU