Как правило, для работы с кодом используются наборы формализованных правил, обеспечивающих порядок, близкий к идеальному. В то же время результаты анализа данных зачастую скапливаются в наборе презентаций, электронных писем и документов Google Docs. В Airbnb решили положить конец этому безобразию, создав внутренний репозиторий знаний, который недавно стал доступен всем желающим, пишет Computerworld.
В проекте объединены возможности контроля версий с помощью git и шаблоны фреймворка для работы с данными Markdown, через который осуществляется возможность вывода информации в разных форматах. Markdown создан для работы с языком программирования R, но также поддерживает и Python.
Именно Python используется во фреймворке от Airbnb. Продукт поддерживает записи в нескольких форматах: Jupyter notebooks, файлы Rmarkdown или «чистый» Markdown.
В начале каждого файла размещён небольшой объём мета-данных. Python-скрипт проверяет корректность данных и преобразует данные в текстовый файл на основе синтаксиса Markdown (для проверки актуальности используют систему пулл-реквестов GitHub). Наконец, веб-приложение на Flask форматирует данные в виде блог-записи.
Проект предлагает различные инструменты использования массивов данных, но акцент делается на notebook-формат (R Markdown и Jupyter/iPython Notebook) для того, чтобы популяризовать «воспроизводимые исследования».
Создатели репозитория данных просят всех заинтересованных помочь в работе над продуктом.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.