Правда о сборе и продаже баз данных

23 мар 2019

Правда о сборе и продаже баз данных

Итак, в качестве примера я буду использовать наш сайт, так будет удобнее и наглядней. Для начала поговорим о том, как именно собираются базы данных компаний. Для того, чтобы собрать информацию нужен источник ее, - источником могут послужить некоторые ресурсы, что специализируются на каталогизации компаний, например, 2 Гис, Яндекс, Гугл ( определенные сервисы гигантов ) и другие. Основная цель вышеперечисленных ресурсов - это денежные средства, т.е. эти каталогизаторы предлагают увеличить узнаваемость вашей компании ( повышение посещаемости, и, как следствие - увеличение потока клиентов,// но, не факт, что так и будет ) за счет рекламы или каких-либо других вещей. Я не утверждаю, что это не работает, часто довольно неплохо действует, однако, - цены у таких услуг кусаются, и, в принципе, им безразличны твои проблемы, главное получить оплату.

Так вот, ресурсы, вроде нашего берут такой источник ( донора ) за основу, собирают с него информацию о компаниях, структуризируют ее для удобства и, в дальнейшем продают. Доноры бывают перспективные и не очень, если продавцу нечем заняться, он продает все. Если продавец подумает - продает данные из перспективного источника, т.е., то, что пользуется спросом. Например, многие продают данные из 2 Гис, многие из Яндекс, Гугл, есть еще Пульс цен, Желтые страницы, Тендер и т.д. ( говорим о данных предприятий ). Мы тоже пробовали многое и остановились на 2 Гис и Яндекс, однако, 2 Гис начал жаловаться и угрожать, в итоге, сейчас и уже несколько лет их базы у нас не продаются, хотя есть доступ для личного пользования.

Мы оставили 1 источник из Яндекс ( он неплох, проверяли рассылкой ) и базируемся на нем. Базы собираются при помощи специального ПО всего на 2-х компьютерах. Больше оборудования задействовать не имеет смысла. Есть ресурсы, что пишут, типа их робот каждый день обходит то и се, обновляя базы - бред бредовый для пользователя. Якобы, базы обновляются каждые 3 дня, ага, мозги у них обновляются каждые 3 дня. К слову 2 Гис добавляет новые объекты у себя 1 раз в месяц, так давайте с него драть одно и то же каждые три дня joy . В Яндекс обновления происходят чаще, но тоже мало смысла  то и дело обновлять.

Другой аспект - мощности. К примеру,- база Московской области собирается 1 сутки, а в среднем время сбора 1-й базы часов 3 - 5. Т.е., например, мы физически не сможем уложиться в обновление всего ассортимента в 3 дня, используя 2 компьютера. Тут или иметь сеть машин, занимающихся сбором, или просто врать, что обновляются базы, потому как - невыгодно. Базы - это очень специализированный товар, особо широким спросом не пользуется. Так вот, например, доход от наших продаж баз весьма скромен, хватает на кое-какие мелочи, естественно себя окупает и небольшой ( это реально ) плюс.

Мы, например, собираем неделю ( грубо говоря с 1-го по 6-е число ), собрали 10-15 баз, обработали их ( а после сбора надо еще немного поработать ) и выкладываем их в магазине, всем им ставим среднюю дату, допустим 3-е число ( между 1 и 6 ). Такова наша схема работы. Так же мы не занимаемся левыми отзывами. На многих аналогичных сайтах есть куча отзывов,- типа как все умопомрачительно, что некто Рубен или Вася Додкин приобрел у них базу и т.д. и т.п... Хотя раздел отзывов у нас на этом сайте появился, может кто и напишет что, если будет по существу без нарушений - будем пропускать.

Основная мысль - при покупке данных ( на любом сайте ), рекомендуем подумать, внимательно все прочитать и логически прикинуть варианты. Если кому-то что интересно еще из этой тематики - пишите в комментах.

Комментариев пока нет, добавьте свой!

Ваш аватар
Вы вошли как Гость