Частоты встречаемости имён, отчеств и фамилий из разрозненных источников

Описание

Данные собраны из различных источников (ЕГРЮЛ, госзакупки, общедоступные открытые реестры). Всего - 375449 фамилий, 32134 имён, 48274 отчеств. Чем ниже частота встречаемости тем ниже точность и качество данных. В записях с частотой 1 может быть очень много ошибок, применяйте с осторожностью. Исходный код для работы с данными и документация по ссылке https://github.com/datacoon/russiannames

Характеристики

Код russiannames
Объём 455,857 записей, 38.7 MB
Всего таблиц 3
Источник ОДСС (https://datacoon.io)
Опубликован True
Открытые данные True
Тэги persons statistics
Условия использования CC-BY-SA
Дата последнего обновления 2019-12-10 10:00:00.758000

Таблицы

Таблица Название Всего записей Объём, байт Схема Экспорт
names Имена 32134 2636958 schema.json jsonl parquet
surnames Фамилии 375449 31336816 schema.json Нет экспорта данных
midnames Отчества 48274 4746358 schema.json jsonl parquet

Сборки

Идентификатор Размер (байт) Дата Тип сборки Скачать Метаданные
odss-russiannames-2021-07-11-05-05 6.7 MB Jul 11 2021 full odss-russiannames-2021-07-11-05-05.zip meta.json