Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Как заработать на больших данных?

ТехнологииIt (информационные технологии)
The Question
  · 9,9 K
История России на дилетантском уровне, бонистика, Дао, электротехника.  · 27 янв 2016

Если брать нашу страну и данные, которые есть на российских ресурсах, то здесь нет ценных данных, которые где-то могли быть качественно использованы. Мы специально разведывали российские источники открытых данных, сейчас многие правительственные организации, мэрии городов выкладывают что-то в сеть, есть ресурсы, посвященные открытым данным. Да, есть по Москве, например, координаты всех катков, прокатов велосипедов и т.д. Но это справочная информация, это не ценный источник данных, который можно подвергнуть аналитике, что-то для себя из них понять. Для сравнения, правительство Лос-Анджелеса выложило в сеть данные по преступлениям и просит создать алгоритм, который будет предсказывать, в каком районе какие виды преступлений могут быть совершены, для того, чтобы эффективно распределять полицейские патрули. Это уже данные, которые представляют интерес. Во-первых, здесь есть четкая задача с ними связанная. Во-вторых, есть потребность в решении этой задачи. Поэтому открытые данные, если они просто лежат, они бессмысленны. Должны быть задачи, которые с ними сопряжены, должен быть заказчик этих задач.

Например, можно предсказывать колебания на цену недвижимости. Существует связь между преступностью и этими ценами. То есть, если в каком-то районе уровень преступности вдруг возрастает, то, соответственно, люди пытаются уехать из этого района, продают квартиры, неохотно туда въезжают. Если вы можете такое предсказать, то на этом можно спекулировать. Но в российских источниках информации я не видел подобных сводок об уровне преступности. В Америке они в открытом виде публикуются сейчас, а у нас это такая более-менее закрытая информация. Если есть кто-то, кто владеет подобного рода информацией, может ее правильно проанализировать, если она может быть использована для прогнозирования каких-то процессов, если она может быть использована для того, чтобы получить от этого выгоду, то, соответственно, эта информация уже начинает пользу приносить не всем жителям, а одному конкретному человеку.

Также рынок развивается в системе здравоохранения, где это связано со спасением жизней людей, когда новые лекарства изобретают только благодаря тому, что мы берем статистику по различным химическим соединениям, которые уже были созданы в лаборатории, и, анализируя все эти свойства, предсказываем, какие свойства будут у новых соединений, и фактически мы предсказываем формулу нового вещества, не проводя лабораторных экспериментов.

В последнее время ведется много разговоров о проектах продажи своих данных. Например, о создании такой соцсети, которая будет гарантировать сохранность вашей информации, но при этом вы сами сможете ее продать. Например, есть агентства, которые запрашивают такую информацию, те же скоринговые агентства, город, клиники и множество других организаций, готовых заплатить какую-то символическую сумму за то, чтобы этой информацией пользоваться.

http://futureurbanism.com/ru/interview/money-from-nothing/

Фанат науки  · 27 янв 2016
Открытые данные - это некие данные, представляющие интерес для определённых людей и компаний, которые при этом находятся в свободном доступе (и могут быть использованы любым способом без ограничений) и в формате, удобном для проведения компьютерных операций. То есть "открытые данные" скорее характеризуют не информацию как таковую, а способ её хранения и распространения.... Читать далее

Можно использовать данные для оптимизации или создания новых бизнесов (продуктов) – начиная с типичной аналитики и BI, заканчивая моделями для предсказания оттока клиентов, персонализации сервисов и рекламы. Эффективность применения зависит от того, какие данные доступны – демографические, поведенческие или слабо-/неструктурированные (например, текст, аудио, картинки).