Московский портал открытых данных: от формата .xLs до хакатонов

27 марта 2014 года

В последние годы Правительство РФ прилагает значительные усилия для повышения открытости государства, стимулируя органы государственной власти (ОГВ) открывать данные о своей деятельности для широкого круга пользователей. Открытые данные - это, как известно, данные о деятельности органов государственной власти, предоставленные для свободного использования широкому кругу пользователей в сети Интернет, как в человекочитаемом виде (таблица), так и в машиночитаемом (специальные форматы для разработчиков в целях повторного использования данных - для построения аналитических справок или для создания мобильных приложений на основе данных).
Примеры наборов открытых данных (на языке технических специалистов - «дата-сетов»), раскрываемых органами государственной власти:
- перечень автозаправок, реализующих некачественное топливо (с указанием компании, адреса расположения заправки и причины несоответствия топлива стандартам);
- комплексы фотовидеофиксации нарушений ПДД (информация по местоположению и режиму работы комплексов фотовидеофиксации);
- бесплатные точки Wi-Fi (местоположения точек с бесплатной Wi-Fi сетью на карте города).

Открытые данные Москвы. Начало
Концепция открытых данных стала широко распространяться в ведущих мировых странах и столицах пять лет назад. В России на этот тернистый путь первой вступила Москва. Правительство столицы еще в 2012 г. создало порталы «Открытый бюджет Москвы», «Дома Москвы», однако эти проекты не позиционировались как проекты открытия данных, раскрываемая информация была достаточно узкоспециализированной и предназначалась для определенного круга пользователей. Когда Москва решила развивать открытые данные как самостоятельный проект, возник целый ряд организационных и технологических проблем. Перед первой публикацией данных в отраслевых органах исполнительной власти города Москвы (ОИВ) не было четкого представления о том, какая информация должна быть представлена. За полгода до момента запуска Портала открытых данных города Москвы (далее - Портал) местные органы исполнительной власти приступили к первичному сбору информации для публикации данных. Этап сбора информации показал, что не все ОИВ были готовы к старту проекта. В частности, можно выделить несколько особенностей хранения данных:
- часть планируемых изначально к публикации данных хранилась на «папирусах» (в бумажном виде) и не была готова к автоматизированной обработке;
- большая часть данных хранилась в формате .xls (привычный формат MS Excel, усложнявший обработку данных для их представления в человекочитаемом виде);
- данные были неструктурированными, отсутствовал единый формат их предоставления и ведения;
- отсутствовал централизованный механизм сбора информации по объектам;
- значительная часть изначально заявленной атрибутивной информации отсутствовала либо сведения были не актуальными. На сбор данных в первичном виде по простому единому стандарту (.csv) потребовалось полгода работы в интенсивном режиме. Портал был запущен 29 января 2013 г. со 130 наборами данных, сгруппированных в 15 категорий: транспорт, строительство, социальная сфера и т. д. Правительство Москвы получило первые отзывы и статистику посещений, а вместе с этим и проблемы, о которых никто ранее даже не задумывался.

Развитие Портала
Разнообразие информации, представленной на Портале, продемонстрировало интерес и активность посетителей. Данные использовались для решения повседневных вопросов (наиболее популярные запросы: местоположения камер на дорогах, школы в районе и т. д.) и для разработки мобильных приложений разработчиками (например, приложения «Аптеки Москвы»). Но вместе с тем пользователю хотелось видеть актуальные и полные наборы данных, что требовало их регулярного обновления. Некоторые ОИВ, опубликовав на портале информацию, получили обращения от активных горожан с фотографиями и списком объектов, отсутствующих в дата-сетах. Изначально вопрос с актуализацией данных решался в срочном порядке в разрезе нескольких наиболее популярных дата-сетов. Однако благодаря сотрудничеству с пользователями общими силами удалось запустить централизованный процесс по улучшению Портала.
Процесс оптимизации работы по раскрытию данных на Портале состоял из следующих ключевых этапов:
- подписание с каждым органом ОИВ графика публикации наборов данных, за которые они ответственны, с четким указанием структуры предоставления данных и сроков публикации;
- принятие документов, регламентирующих деятельность ОИВ при раскрытии и актуализации данных:
• постановление правительства Москвы по официальному вводу в действие Портала;
• регламент с правилами взаимодействия органов исполнительной власти с Порталом открытых данных в части подготовки и первичного открытия наборов данных;
• регламент обновления - правила обновления уже размещенных на Портале открытых данных;
• регламент обработки сообщений пользователей - правила обработки обращений от пользователей в электронном виде;
- конструктивный диалог с пользователями в целях учета их пожеланий по публикации дата-сетов. Все пожелания пользователей централизованно направляются в отраслевые ОИВ на проработку для оценки возможности публикации дата-сета. В результате значительная часть данных была открыта для широкого круга пользователей (по итогам года - более 70 дата-сетов);
- организация централизованного процесса нормализации данных (приведение всех данных к единому стандарту). В настоящее время более 50% дата-сетов нормализовано, и эта работа продолжается;
- создание для разработчиков API специализированного программного механизма, позволяющего в удобном виде получать размещенные на Портале данные и использовать их для создания собственных программных продуктов (чаще всего приложений для мобильных устройств);
- подготовка для каждого дата-сета паспорта набора открытых данных - основного документа, в котором детально прописываются правила ведения и обновления данных. При подготовке и утверждении некоторых паспортов были пересмотрены существовавшие ранее процессы сбора и актуализации данных (например, изменился процесс сбора данных по каткам, горнолыжным склонам, аттракционам, паркам и др.).

Портал открытых данных Москвы сегодня
На сегодняшний день Портал открытых данных правительства Москвы - централизованная площадка, на которой раскрывается подписанная электронной подписью информация, находящаяся в ведении ОИВ и органов местного самоуправления. Органы исполнительной власти ведут активную работу по нормализации данных с учетом пожеланий граждан. Публикуются, в частности, популярные среди пользователей Портала сезонные дата-сеты. Сложившаяся ситуация подтверждает потребность граждан в большей открытости органов исполнительной власти, а также в организации централизованной площадки предоставления официальной государственной информации.
В настоящее время на Портале размещено более 240 дата-сетов, и их количество постоянно увеличивается (до конца года планируется опубликовать примерно 80 новых наборов данных). Регулярно публикуются сезонные дата-сеты, особо востребованные у населения. Размещены здесь и другие актуальные сведения, в частности информация о «Доступной среде». Это проект по описанию доступности объектов городской инфраструктуры для жителей с ограни¬ченными возможностями. Тот факт, что к проекту стали привлекаться независимые организации в целях мониторинга качества предоставляемых данных (в том числе Общество инвалидов), подчеркивает его востребованность и социальную значимость. Независимыми разработчиками на основе открытых данных были созданы социально значимые приложения, такие как: «На каток» (включающий информацию по всем каткам Москвы с подробной атрибутивной информацией, пока¬зывающей наличие на катке освещения, пунктов проката, заточки, раздевалки и т. д.); «Мамнадзор» (удобное приложение для молодых мам, позволяющее найти в любом районе Москвы молочную кухню, поликлинику и др.); «Аптеки», а также ряд других приложений, пользующихся популярностью среди населения. Данные для своих проектов используют и компания Yandex, и mail.ru, и Rambler, и сервис inTaxi. На основе открытых данных могут быть созданы как коммерческие, так и бесплатные приложения. Это позволяет посмотреть на использование открытых данных с точки зрения разработки ПО и его дальнейшей монетизации. Наборы открытых данных, опубликованные на Портале, востребованы не только конечными пользователями и разработчиками, но и различными государственными интернет-ресурсами. Так, набирающий особую популярность портал «Наш город» (gorod.mos.ru), где москвичи могут оставить сообщение по проблемным темам (не работает светофор, разбит асфальт во дворе, сломаны почтовые ящики в подъезде и т. д.), использует открытые данные для определения местоположения объектов городского хозяйства.

Прогнозы и перспективы
Портал открытых данных правительства Москвы постоянно развивается. В этом году все информационные системы города будут переведены на единый источник данных, что позволит интегрировать Портал открытых данных правительства Москвы с Порталом государственных услуг города Москвы. Для этого необходимо привести все данные к единому виду. Сейчас осуществляются нормализация данных, унификация и увеличение объема поступающей информации (на момент публикации выполнено около половины запланированной работы), внедрение связанности данных (контекстно объединенные между собой наборы данных по общему признаку). Будет продолжена работа по публикации новых дата-сетов в соответствии с пожеланиями пользователей. В целях упрощения использования данных при создании мобильных приложений для разработчиков буден доработан созданный API. Кроме того, планируется проведение хакатонов (специализированных конкурсов для разработчиков по созданию мобильных приложений на основе открытых данных). Хакатоны очень популярны в США и странах Европы, поскольку стимулируют развитие малого бизнеса и начинают играть все более заметную роль при формировании стартапов в высокотехнологичной отрасли экономики. К примеру, в рамках хакатона в Нью-Йорке было разработано приложение MyCityWay (оптимальное планирование маршрутов внутри города на общественном транспорте, личном автомобиле или пешком - с учетом пробок, близости ближайшего транспорта, наличия парковых зон на пути следования и т. д.). Разработчики получили главный приз из рук мэра Нью-Йорка, что подчеркивает высокий статус мероприятия. Проект сразу привлек инвестиции. По словам инвесторов, они увидели в приложении огромный потенциал и помогли разработчикам выйти на рынок. Раскрытие данных на Портале позволило открыть нужные данные для пользователей и выстроить с ними конструктивный диалог. Кроме того, это обеспечило возможность навести порядок внутри органов исполнительной власти, создав единый источник данных не только для общегородских проектов, но и для каждого ОИВ. Исходя из пожеланий граждан и требований, предъявляемых ими к ОИВ, цель «открытых данных» - создать удобное «открытое электронное общество».

Иван Фост, руководитель проекта «Открытые данные», Департамент информационных технологий города Москвы

Мнение специалиста
Павел ЗАРГАРЯН, заместитель генерального директора компании «Прогноз» - разработчика Портала открытых данных Правительства Москвы:
- Прозрачность деятельности органов государственной власти - основная парадигма последнего десятилетия во внутренней государственной политике развитых стран, а «открытые данные» - важный принцип взаимодействия государства, бизнес-сообщества и граждан. Отрадно наблюдать, что Россия в данном подходе не является исключением. Благодаря широкому раскрытию ведомственной информации растет доверие к власти со стороны общества и бизнес-структур, формируется среда для взаимовыгодного сотрудничества: государственные органы упорядочивают и оптимизируют внутренние бизнес-процессы, коммерческие структуры имеют возможность, используя актуальные данные, выпускать продукцию и создавать различные сервисы, граждане получают полезную информацию и приложения. «Открытые данные» - это не только информация, предоставленная органами государственной власти, но и комплексное технологическое решение. После размещения данных в сети необходимы их постоянная актуализация и выверка, а также централизация предоставления. Неотъемлемой частью такой технологии является автоматизация всего сложного процесса раскрытия данных - от сбора до их публикации в разнообразных форматах для различных групп пользователей. Необходимым условием эффективного взаимодействия общества и государства являются популяризация использования «открытых данных» и установление обратной связи с пользователями: выявление потребностей и учет пожеланий, мониторинг обращений к наборам данных, активное вовлечение в процесс их реинжиниринга.


Connect! № 1–2, 2014