Комментарии к ответу на предложения по ОД Ростуризма - Реестр туроператоров РФ

Прежде всего хочу поблагодарить вас за оперативный ответ!

1. RDF-метки присутствуют, добавлены в полном соответствии со схемой, предложенной в методических рекомендациях версии 3.0. Метки можно проверить по этой ссылке:
http://www.google.ru/webmasters/tools/richsnippets?q=http%3A%2F%2Fopenda... .

Как видите, все необходимые указания на csv-файлы и с данными, и со структурой присутствуют, и в машиночитаемом виде в том числе.

Далее. Эти же указания на csv файлы присутствуют и в машиночитаемой версии паспорта набора данных (http://opendata.russiatourism.ru/7708550300-ReestrRosturizm77B/meta.csv )

Т.е. есть как минимум 2 пути получения в машиночитаемом виде ссылок на данные - проанализировав машиночитаемую версию паспорта или проанализировав соответствующие RDF-метки в человекочитаемой (html) версии паспорта.

Действительно паспорт соответствует МР3.0... Не знал, что МР даже 3ей версии такие кривые...

Обратите внимание, что ссылка на актуальный набор не помечена и не извлекается парсером.

Получается, что ключевой элемент информации в паспорте - ссылка на набор – должен вычисляться исходя из "версии набора" и "версии структуры", значение которых можно лишь угадать:

- Файл имеет название «data-<Версия набора>-structure-<Версия структуры>.csv», где <Версия набора> это версия набора открытых данных в формате «ISO 8601», с точностью не ниже чем «День», и <Версия структуры> это версия соответствующей структуры набора открытых данных в формате «ISO 8601», с точностью не ниже чем «День».

Мне остается только попросить вас, чтобы вы пометили значение строки 8 (Гиперссылка (URL) на открытые данные) элементом "dc:source" (это не должно противоречить МР).

Дополнение!
Я проконсультировался с экспертами и мне подсказали, что ссылки на все версии набора, включая актуальную, размещаются в элементе dc:collection, у вас он есть, но актуальная версия пропущена (только версии от 1 июля и 1 августа) – так что решение проблемы в добавлении текущей версии в элемент dc:collection

2. Паспорт набора данных содержит тестовые сведения об ответственном лице. По окончанию тестирования сведения не были заменены. Работа проведена, актуальные сведения об ответственном внесены и отображаются в человекочитаемом формате паспортов наборов на сайте Ростуризма http://opendata.russiatourism.ru/7708550300-ReestrRosturizm1A. Обновление CSV файлов с паспортами наборов произведено 07.08.2014 в 00:00.

Выражаю вам благодарность за столь оперативное реагирование!

3. Используемый формат публикации открытых данных (CSV) предусматривает только одну ячейку под запись о финансовом обеспечении туроператоров. Наборы данных будут доработаны с учетом озвученной потребности публиковать не одну, а несколько записей о финансовом обеспечении каждого туроператора.

Просим при возможности пояснить по поводу того, как обеспечить наличие в наборах открытых данных полных сведений о финансовом обеспечении туроператоров. Нами используется формат CSV, соответственно под запись о финансовом обеспечении туроператора выделена одна ячейка csv-таблицы. Корректным ли будет использовать, например, такой формат записи: "Первая запись | Вторая запись | Третья запись" (или любой другой разделитель)? Или, возможно, существуют другие варианты, при которых получится решить эту проблему, не выходя за рамки избранного формата (csv)? В Методических рекомендациях версии 3.0 подобных указаний по данному нас вопросу нет.

Предложенный вами метод приемлем, если будет обеспечено отсутствие разделителя в данных.
Или разбить набор на 2 файла: собственно реестр и финансовые обесепечения.
Или размещать второе и последующее обеспечение в отдельных строках, заменять значения реестрового номера, адреса, наименования и прочих неизменяемых атрибутов ТО плейсхолдерами, что будет обозначать "продолжение данных" и на каждого ТО сможет приходится более 1 строки.

Все эти способы плохи - всё это «костыли». Желательно перейти на формат поддерживающий иерархию (XML и JSON).

Ранее по этой теме:

Комментарии

Мда... выводить структурированные данные в CSV...

Обычно продумывают структуру данных и выбирают подходящий формат, а не сперва формат – потом вопрос "как решить эту проблему, не выходя за рамки избранного формата?"

Удачи

Добавить комментарий

Plain text

  • HTML-теги не обрабатываются и показываются как обычный текст
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Строки и параграфы переносятся автоматически.
CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.