Академия Google

Академия Google (англ. Google Scholar) — бесплатная поисковая система по полным текстам научных публикаций всех форматов и дисциплин. Проект работает с ноября 2004 года, первоначально в статусе бета-версии. Индекс «Академии Google» включает данные из большинства рецензируемых онлайн журналов крупнейших научных издательств Европы и Америки. По функциям «Scholar» похож на сайты Scirus?!, CiteSeerX?! и GetCITED. Также «Scholar» похож на сайты, предоставляющие доступ к публикациям после оформления платной подписки, например, Scopus и Web of Science. Рекламный слоган «Академии Google» — «стоя на плечах гигантов» — часть знаменитого высказывания И. Ньютона «Если я видел дальше других, то потому, что стоял на плечах гигантов», дань учёным, вносившим вклад в развитие науки на протяжении веков и обеспечившим основу для новых открытий и достижений.

Академия Google
Изображение логотипа
URL scholar.google.com
Тип сайта поиск по научным публикациям
Регистрация необязательная
Язык (-и) английский[1], немецкий[1], испанский[1], французский[1], каталанский[1], чешский[1], датский[1], филиппинский язык[1], хорватский[1], индонезийский я
зык
[1], латышский язык[1], литовский язык[1], венгерский[1], нидерландский[1], норвежский[1], польский[1], португальский[1], бразильский португальский[1], румынский[1], словацкий язык[1], словенский[1], финский[1], шведский[1], вьетнамский[1], турецкий[1], греческий[1], болгарский[1], русский[1], сербский[1], украинский язык[1], иврит[1], арабский[1], персидский[1], хинди[1], тайский[1], корейский[1], упрощённый китайский[1], гоюй[1] и японский[1]
Владелец Google
Автор Google
Начало работы ноябрь 2004 года
Текущий статус работает и развивается
Логотип Викисклада Медиафайлы на Викискладе

Содержание

История

Начало проекта «Google Академия» было положено обсуждением между Алексом Верстаком (Alex Verstak) и Анурагом Ачарья (Anurag Acharya), впоследствии работавших над созданием поискового индекса Google[2][3].

В 2006 году компания Microsoft запустила проект «Windows Live Academic Search». После появления потенциального конкурента в «Академию Google» добавили возможность импорта цитат в программы для управления библиографической информацией (такие как RefWorks (англ.), RefMan, EndNote и BibTeX). Аналогичные возможности также реализованы в других поисковых системах, например, в CiteSeer и Scirus (англ.).

В 2007 году Ачарья (Anurag Acharya) объявил о начале «Академией Google» программы по оцифровке и хостингу статей из журналов. Программа реализовалась по соглашению с издателями и независимо от проекта Google Books. Сканы старых журналов от проекта Google Books не включали метаданные, необходимые для поиска конкретных статей по конкретным областям знаний[4].

В 2011 году Google переработал верхнюю панель сайта google.com и удалил из неё ссылку на «Scholar»[5]. Это усложнило доступ к проекту.

Особенности и технические характеристики

«Академия Google» выполняет поиск не только по статьям, доступным онлайн, но и по статьям, доступным только в библиотеках или за деньги[6]. «Научные» результаты поиска генерируются с использованием ссылок из «полнотекстовых журнальных статей, технических отчётов, препринтов, диссертаций, книг и других документов, в том числе выбранных веб-страниц, которые считаются „научными“»[7]. В результатах поиска «Scholar» выводит ссылки на статьи. Большинство из ссылок ведут на страницы, содержащие краткую информацию о статье; возможно, за доступ к полному тексту статей придётся заплатить[7]. «Расширенный поиск» позволяет искать в конкретных журналах или статьях[8]. Результаты поиска сортируются[9]:

  • по рейтингу автора;
  • количеству ссылок на статью;
  • рейтингу статей, ссылающихся на найденную статью;
  • рейтингу журналов, в которых опубликованы ссылающиес
    я статьи;
  • рейтингу журнала, в котором опубликована найденная статья.

Из блока «Цитируется в» можно узнать список статей, в которых цитируется рассматриваемая статья[10]. Эта функция, в частности, обеспечивает индекс цитирования, ранее доступный только в Scopus и Web of Knowledge. Данный индекс может быть использован при вебометрическом ранжировании сайтов[11].

В блоке «Статьи по теме» выводится список статей, похожих по содержанию с рассматриваемой статьёй. Статьи упорядочены по степени сходства с рассматриваемой статьёй и по своей значимости[12].

По состоянию на март 2011 года к «Академии Google» всё ещё нельзя получить доступ с помощью Google APIs (англ.).

Алгоритм ранжирования

Большинство академических баз данных и поисковых систем позволяют пользователям выбрать параметр, по которому нужно сортировать результаты поиска. Например, «актуальность», «количество цитат» или «дата публикации». «Академия Google» для ранжирования результатов поиска использует комбинированный алгоритм. Алгоритм учитывает полный текст каждой статьи, рейтинг автора, рейтинг издания, в котором статья опубликована, количество цитат из публикации, опубликованных в другой научной литературе[9]. Исследования показали, что «Академия Google» придаёт особенно большой вес количеству цитирований[13] и словам, содержащимся в заголовке документа[14]. Как следствие, первые ссылки в результатах поиска зачастую ведут на более цитируемые статьи.

Ограничения и критика

Некоторые пользователи считают «Академию Google» сопоставимой по качеству и полезности с коммерческими базами данных[15], хотя её пользовательский интерфейс (UI) все ещё находится в бета-версии.

Проблемой «Академии Google» является недостаток данных о её охвате. Некоторые издатели не позволяют «Академии» индексировать свои журналы. Журналы издательства Elsevier не были включены в индекс до середины 2007 года. Затем издательство Elsevier открыло сайт ScienceDirect, и краткое содержание публикаций стало доступно в поиске Google[16]. По состоянию на февраль 2008 года в поисковом индексе по-прежнему отсутствуют журналы Американского химического общества, изданные за последние годы.

«Академия Google» не публикует список обхода научных журналов. Частота её обновления также неизвестна.

Также можно отметить отсутствие удобных инструментов, имеющихся у многих подобных систем, что в свете требований ФАНО к предоставлению данных об организациях создаёт существенные проблемы подотчётным учреждениям, вынуждая их изобретать суррогатные решения, вносящие информационный шум в базы данных «Академии Google». Например, созданы фиктивные профили учёных для измерения числа публикаций и цитирований сотрудников институтов СПИИРАН[17] и ИПМИ КарНЦ РАН[18].

Примечания

  1. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 https://scholar.google.com/scholar_settings
  2. Hughes, Tracey (декабрь 2006 года) «An interview with Anurag Acharya, Google Scholar lead engineer» Google Librarian Central.
  3. Assisi, Francis C. (3 January 2005) «Anurag Acharya Helped Google’s Scholarly Leap» INDOlink
  4. Barbara Quint : Changes at Google Scholar: A Conversation With Anurag Acharya Information Today, 27 августа 2007 года.
  5. 20 Services Google Thinks Are More Important Than Google Scholar — The Atlantic
  6. Google Scholar Library Links
  7. 1 2 Vine, Rita (January 2006). “Google Scholar”. Journal of the Medical Library Association. 94 (1): 97—9. PMC 1324783. Используется устаревший параметр |month= (справка)
  8. [1] (недоступная ссылка)
  9. 1 2 About Google Scholar  (неопр.). Scholar.google.com. Дата обращения: 29 июля 2010. Архивировано 29 марта 2012 года.
  10. Google Scholar Help
  11. Рейтинг официальных сайтов, 2007.
  12. Official Google Blog: Exploring the scholarly neighborhood
  13. Jöran Beel and Bela Gipp. Google Scholar’s Ranking Algorithm: An Introductory Overview. In Birger Larsen and Jacqueline Leta, editors, Proceedings of the 12th International Conference on Scientometrics and Informetrics (ISSI’09), volume 1, pages 230—241, Rio de Janeiro (Brazil), июль 2009 года. International Society for Scientometrics and Informetrics. ISSN 2175—1935.
  14. Jöran Beel and Bela Gipp. Google Scholar’s Ranking Algorithm: The Impact of Citation Counts (An Empirical Study). In André Flory and Martine Collard, editors, Proceedings of the 3rd IEEE International Conference on Research Challenges in Information Science (RCIS’09), pages 439—446, Fez (Morocco), апрель 2009 года. IEEE. doi: 10.1109/RCIS.2009.5089308. ISBN 978-1-4244-2865-6.
  15. Bauer, Kathleen, Bakkalbasi, Nisa (сентябрь 2005 года) «An Examination of Citation Counts in a New Scholarly Communication Environment» D-Lib Magazine, Volume 11, No. 9
  16. Peter Brantley: Science Direct-ly
    into Google
    O’Reilly Radar, 3 July 2007
  17. Профиль учёного с именем «St. Petersburg Institute for informatics and automation» OR спииран OR spiiras OR СПИИРАН OR» // Академия Google
  18. Профиль учёного с именем «Institute of Applied Mathematical Research of the Karelian Research Centre of the Russian Academy of» // Академия Google

Литература

Ссылки