Шрифт:
Интервал:
Закладка:
Статистика Mindat поражает. Добавлять фотографии минералов, описывать их местонахождения и редактировать данные по ним могут почти 50 000 зарегистрированных пользователей. В совокупности они загрузили сотни тысяч фотографий образцов. Были внесены данные по 300 000 участков по всему миру, а количество индивидуальных минералогических находок перевалило за миллион. Это изумляет Ральфа: «Я не ожидал, что сайт настолько разрастется. Он начал руководить моей жизнью!»
Джолион, который сейчас работает в полную силу, управляя Mindat и расширяя его, как никто другой понимает, что работа не окончена. Покрытие некоторых богатых минералами географических зон, в частности Китая, неполно. Многие места плохо описаны (Ральф пытается добавить ко всем ним GPS-координаты). Более того, на таком краудсорсинговом ресурсе, как Mindat, всегда будут досадные ошибки и искажения фактов. Коллекционеры иногда допускают неточности в идентификации своих находок, и они скорее сообщат о редких видах, которые встречаются в форме цветных кристаллов, чем о гораздо более распространенных белых или серых неприметных породообразующих минералах. Тем не менее десятилетия усилий и организационных стараний Джолиона Ральфа привели к тому, что его Mindat.org преобразовал минералогию и открыл потрясающие новые возможности для минералогических исследований.
Экология минералов
Благодаря всеобъемлющему списку минеральных видов Боба Даунса и огромной подборке местонахождений минералов Джолиона Ральфа мечта DCO каталогизировать все кристаллические формы углерода на Земле вполне осуществима. О чем говорит нам вся эта информация? Этим вопросом мы задались в 2014 г., когда начали искать скрытые закономерности в нагромождении данных.
Первым, что нас поразило, было неравномерное распределение земных минералов — тенденция, наблюдаемая, как правило, в биологических экосистемах. Несколько десятков минералов встречаются в тысячах мест, в то время как большинство других — чрезвычайно редкие. Полдесятка видов минеральной группы полевого шпата, по оценкам, составляют 60% объема земной коры{40}. Несколько десятков других распространенных минералов составляют почти все остальное. А более 1200 минеральных видов, напротив, известны только по уникальным находкам в единичных местонахождениях. Еще более 600 видов найдены всего в двух местах, а почти 400 — описаны лишь из трех. Общий обзор данных по местонахождениям в Mindat.org показывает, что более половины всех зарегистрированных минералов происходят из пяти или менее мест. Поразительный вывод: большинство минералов — очень редкие.
Тогда мы задумались: является ли такое неравномерное частотное распределение с малым количеством очень распространенных видов и намного более многочисленными редкостями характерным для природы в целом?{41} Может ли литература по социологии, экономике, географии или другим областям знаний показать аналогичное частотное распределение? Существует ли уже признанный математический подход для описания подобной взаимосвязи с преобладанием редкостей, который мы можем использовать, чтобы понять распределение минералов?
Ответ пришел (как это часто бывает) в несвязанном, казалось бы, контексте — во время прогулки в лесу. В июне 2014 г. Мэттью Скотт, недавно назначенный президентом Института Карнеги, пригласил меня к себе домой в Пало-Альто, чтобы поговорить о науке, жизни и будущем института. Мэтт — родственная мне душа, с той же страстью к концептуализации и междисциплинарному мышлению. Он внес весьма революционный вклад в клеточную биологию и биологию развития, да к тому же был главой амбициозной лаборатории Bio-X в Стэнфордском университете, где работают исследователи, занятые в передовых междисциплинарных проектах, которые связывают биологию с медициной, инженерными науками, физикой и химией. Благодаря активности Мэтта лаборатория получила 1 млрд долларов на новейшее оборудование. Теперь же он предвкушал новые приключения, руководя обновленным Институтом Карнеги, в котором проводились связанные между собой исследования Земли, космоса и живой природы.
Вместо того чтобы просто сидеть и разговаривать, мы пошли на прогулку по живописному скалистому побережью Северной Калифорнии и зашли в ближайший лес с древними массивными секвойями. Проходя мимо внушительных хвойных деревьев, я поражался неравномерному распределению растительной и животной жизни. Бо́льшая часть биомассы этой экосистемы скопилась на гигантских секвойях, а оставшаяся — на нескольких других крупных доминирующих видах деревьев и кустарников. Но львиная доля биоразнообразия была представлена гораздо более мелкими видами: мхами, папоротниками, насекомыми, певчими птицами и яркоокрашенными калифорнийскими банановыми слизнями, не говоря уже о бесчисленных невидимых микроскопических формах жизни. Шагая, я размышлял: а не может ли распределение биомассы в экосистеме отображать распределение минералов на Земле?
Разгадка появилась из неожиданного источника несколько дней спустя, когда я искал статьи по частотному распределению{42}. Ответом послужили слова. Оказалось, что характерное распределение слов в книге необыкновенно похоже на распределение минералов на Земле. Давайте рассмотрим эту мою книгу. Как и все, я часто использую здесь артикли и союз «и» — возможно, сотни раз. Другие часто используемые слова более характерны для данной конкретной истории: первыми приходят на ум «минерал», «алмаз» и «углерод».
Вы, возможно, видели «облака слов», или Wordles, в которых крупным шрифтом выделяются самые распространенные ключевые слова в тексте. Те, которые вы не видите в «облаке», — это более редкие слова, которые использовались всего один или два раза. И в эту категорию попадает намного больше разных слов. Здесь слово Wordle появляется только единожды (упс, полагаю, теперь уже дважды). То же самое можно сказать о «Чосере», «тилапии» и «уиджимулталите». На самом же деле анализ этих редких слов может однозначно указать на тему, жанр и даже авторство документа. Вот если бы вы нашли старую рукопись и захотели узнать, кто ее написал? Такие редкие, характерные слова и фразы могут помочь выявить ранее неизвестные произведения Диккенса, Чосера или Шекспира.
Подобная закономерность — с несколькими распространенными элементами и многочисленными редкими — называется распределением «большого числа редких событий» (или сокращенно БЧРС). Вы, возможно, полагаете, что исследование распределений БЧРС относится к сфере компетенции какого-то захолустья прикладной математики и интересует всего лишь нескольких историков и литературоведов. Однако это не так: глобальная борьба с терроризмом сделала лексическую статистику горячей темой. Агентство национальной безопасности хочет знать, кто что пишет и кому. БЧРС-анализ — даже просто электронного письма, короткого документа или записи телефонного разговора — может дать убедительные подсказки. Как следствие, на БЧРС-исследования потекли деньги. В последние годы вышли толстые учебники, напичканные математическими формулами, а мудреные статистические программы для БЧРС-анализа доступны онлайн и бесплатны.
Погружение в мельчайшие подробности столь сложной математики не для слабонервных, и