Abstract

Wikipedia is one of the most visited sites on the Web and a common source of information for many users. As an encyclopedia, Wikipedia was not conceived as a source of original information, but as a gateway to secondary sources: according to Wikipedia’s guidelines, facts must be backed up by reliable sources that reflect the full spectrum of views on the topic. Although citations lie at the heart of Wikipedia, little is known about how users interact with them. To close this gap, we built client-side instrumentation for logging all interactions with links leading from English Wikipedia articles to cited references during one month, and conducted the first analysis of readers’ interactions with citations. We find that overall engagement with citations is low: about one in 300 page views results in a reference click (0,29% overall; 0,56% on desktop; 0,13% on mobile). Matched observational studies of the factors associated with reference clicking reveal that clicks occur more frequently on shorter pages and on pages of lower quality, suggesting that references are consulted more commonly when Wikipedia itself does not contain the information sought by the user. Moreover, we observe that recent content, open access sources, and references about life events (births, deaths, marriages, etc.) are particularly popular. Taken together, our findings deepen our understanding of Wikipedia’s role in a global information economy where reliability is ever less certain, and source attribution ever more vital.

Highlights

  • Джованни Колавицца Лаборатория цифровых общественных наукАннотация: Википедия является одним из самых посещаемых сайтов в интернете и распространённым источником информации для многих пользователей.

  • Хотя цитаты лежат в основе функционирования Википедии, пока мало что известно о том, как пользователи работают с ними.

  • Мы создали клиентские (пользовательские) инструменты для ведения записей (журналов) всех взаимодействий со ссылками, идущими из англоязычных статей Википедии на цитируемые ссылки в течение одного месяца, и провели первый анализ взаимодействия читателей с цитатами.

Read more

Summary

Джованни Колавицца Лаборатория цифровых общественных наук

Аннотация: Википедия является одним из самых посещаемых сайтов в интернете и распространённым источником информации для многих пользователей. Хотя цитаты лежат в основе функционирования Википедии, пока мало что известно о том, как пользователи работают с ними. Мы создали клиентские (пользовательские) инструменты для ведения записей (журналов) всех взаимодействий со ссылками, идущими из англоязычных статей Википедии на цитируемые ссылки в течение одного месяца, и провели первый анализ взаимодействия читателей с цитатами. Исходя из этого можно предположить, что ссылки чаще всего требуются, когда Википедия не содержит информацию, которую ищет пользователь. Общая статистика англоязычной Википедии К моменту завершения работы по сбору данных англоязычная Википедия содержала 5,8 млн статей, 5,4 млн (95%) из которых при подготовке наших данных были загружены по крайней мере один раз, в общей сложности состоялось 7,4 млн просмотров. 2а показано нарастающим итогом (дополнительное кумулятивное) распределение популярности для страниц Википедии, которые были просмотрены хотя бы один раз за период сбора данных На рис. 2а показано нарастающим итогом (дополнительное кумулятивное) распределение популярности для страниц Википедии, которые были просмотрены хотя бы один раз за период сбора данных

CCDF of Wikipedia articles by pageviews
Quality Category
Темп перехода кликов
Влияние положения ссылки на странице
Findings
Relative position

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.