chitay-knigi.com » Домоводство » Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Жан-Батист Мишель

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 56 57 58 59 60 61 62 63 64 65
Перейти на страницу:

Жизнь тяжела

Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Новые времена

Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Великие умы

Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Мудрые слова

Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
О графиках

Графики в этой книге были созданы под впечатлением от великолепного визуального стиля веб-комикса xkcd авторства Рэндалла Манро (http://xkcd.com/). Идея автоматизации создания графиков в стиле xkcd была предложена Дэймоном Макдугаллом. Графики в самой книге создавались в программе Python, с использованием модифицированной версии программы Джейка Вандерпласа. Эти n-грамы можно создавать интерактивно на сайте Google Ngram Viewer: http://books.google.com/ngrams/, а в стиле xkcd – по адресу http://xkcd.culturomics.org. Мы надеемся, что Манро не будет на нас в обиде (см. http://xkcd.com/1007/ и http://xkcd.com/1140/). Некоторые из его любимых n-грамов можно найти по адресу: http://xkcd.com/ngram-charts/.

Обратите внимание, что данные приводятся с учетом регистра, а вид графиков n-грамов зависит от нескольких параметров. Если в заметках не указано иное, то все графики n-грамов, приведенные в тексте книги, в точности соответствуют результатам работы Google Ngram Viewer, при использовании корпуса English 2012 и трехлетнего сглаживания. Также, если не указано иное, текст запроса приводится полностью в нижнем регистре, за исключением имен собственных, которые пишутся как обычно. Все соответствующие массивы данных для работы можно загрузить по адресу: http://goo.gl/3IIA9.

При упоминании конкретных n-грамов, таких как Marc Chagall и Kubismus в корпусе на немецком языке, они указываются в виде NV: «Marc Chagall, Kubismus»/German. В случае если корпус не указан (например, NV: «cubism»), использовался корпус English 2012. В ряде случаев мы указываем диапазон лет или значение параметра сглаживания.

1 ... 56 57 58 59 60 61 62 63 64 65
Перейти на страницу:

Комментарии
Минимальная длина комментария - 25 символов.
Комментариев еще нет. Будьте первым.
Правообладателям Политика конфиденциальности