Content Downloader - программа для парсинга, подготовки и импорта контента

Content Downloader - программа для парсинга, подготовки и импорта контентаРано или поздно перед вебмастером встает проблема в раширении количества сателлитов и увеличения контента сайтов. В этом может помочь и существенно облегчить жизнь программа, которая предназначена для выкачивания контента из блогов, каталогов статей, веб-порталов, а также его обработки и импорта в популярные КМС. Программа немного сложновата в освоении, но зато позволяет скачивать чистый контент с сайтов (включая изображения) и сохранять его на диск в txt или htm виде.

В качестве бонуса для читателей моего блога предлагаю 5% скидку при покупке данной проги у разработчика.

 

Итак, немного непосредственно о программе:

Системные требования:

  • Windows XP;
  • Иинтернет канал в 128 и более кбит/с.

Преимущества программы:

  • Подходит под 90% сайтов в сети;
  • Позволяет скачивать чистый контент (только текст статьи);
  • Многопоточная загрузка контента;
  • Позволяет сохранять изображения;
  • Сохранение контента в txt и htm виде;
  • Импорт в популярные CMS + предпубликационная обработка (автокартинки, автометки и прочее);
  • Гибкая настройка парсинга.

Минусы программы:

  • Для работы с продуктом требуются определенные навыки.

Поддерживаемые CMS:

  • Zebrum;
  • Zerber;
  • Wordpress;
  • Satellite-X
  • Autoblog-X;
  • Импорт по шаблону (подходит почти для всех CMS);
  • Создание статических html и php сайтов (с функцией автовставки кодов бирж).

Принцип работы программы заключается в следующем: Программа загружает статьи по прямым ссылкам на них с помощью функции парсинга ссылок со страниц, карты сайта и функции создания списка ссылок по шаблону.

Content Downloader - программа для парсинга, подготовки и импорта контентаПорядок работы с программой:

Парсинг контента

  • Открываем программу, идем в настройки, выбираем раздел «ссылки».
  • В список ссылок добавляем карту сайта и смотрим, какие ссылки предполагается получить.
  • Если страниц слишком много, то задаем границы парсинга. Выделяем ссылку в списке и в опциях задаем границы парсинга.
  • После этого настраиваем фильтры.
    Вводим стартовый url для сканирования всего сайта и жмём кнопку «получить ссылки».
  • Удаляем из списка полученных ссылок категории и прочие гадости. Теперь мы имеем только ссылки на статьи.
  • Переходим на вкладку «контент», выбираем любую ссылку и задаем границы парсинга для содержимого (начало и конец).
  • Ссылаемся для чистоты нашей совести на первоисточник, указываем путь для сохранения и выбираем формат html.
  • Включаем загрузку картинок для сохранения в одну папку (кнопка «дополнительно» позволяет указать имя этой папки и выбрать прочие опции).
  • Далее настраиваем заголовок. Для этого указываем границы парсинга для заголовка.
  • Потом устраиваем предпросмотр любого элемента из списка (двойной клик либо иконка с лупой).
  • Если все хорошо, то начинаем парсинг с помощью зелёной двойной стрелочки.

Усе, парсинг закончен, сграбленный контент лежит в нашей папке, идем в эту папку и можно заняться экспортом контента.

Экспорт контента

  • Давим на кнопку «Обработка и импорт в КМС» и спомощью расширенной функции добавления файлов добавляем спарсеные файлы.
  • Потом выбираем массовую обработку файлов, переходим на вкладку «автозаполнение полей», правим необходимые поля в соответствии с поставленными задачами, меняем заголовки на собственные, добавляем, удаляем все что захотим.
  • Так же можно автоматически проставить во все статьи тег < !--more-- > на вкладке «автопростановка тегов».
  • В разделе «чистка документов» можно удалить пустые строки в документах.
  • На вкладке «преобразование < img >» нужно удалить все префиксы и добавить свой префикс ко всем картинкам.
  • Следующий шаг - это закачка спарсенных изображений в нужный каталог вашего сайта.
  • Возвращаемся в программу и сохраняем всё, нажав на соответствующую иконку программы, затем приступаем к созданию файла импорта также нажав на соответствующую иконку.
  • В открывшемся окне указываем путь для сохранения, необходимую CMS и планируем публикацию на свой фкус и цвет :).
  • Давим на кнопку «создать файл импорта» и переходим к импорту материалов на сайт.

Ну а дальше импортируем данный файл через админку используемой вами CMS и радуемся тому что данную замечательную программу Вы приобрели со скидкой 5%.

Оформление покупки:

Цена от Narodlink.ru на Content Downloader: 37 WMZ - 5% (Скидка от Narodlink.ru) = 35,15 WMZ
Цена от Narodlink.ru на Content Downloader: 1147 WMR - 5% (Скидка от Narodlink.ru) = 1089.65 WMR

Перечислите деньги на любой из этих кошельков:

WMR R343596475065
WMZ Z201847902942

В платеже обязательно укажите свой e-mail, наименование программы и наш ID: 077narodlink.ru для получения скидки: Оплата Content Downloader, user@mail.ru, 077narodlink.ru

После оплаты Вы получите письмо с инструкциями, ссылками и паролями для скачивания и установки программы.

Задать любые вопросы по программе вы можете на сайте и форуме разработчика: Content Downloader - программа для парсинга и импорта контента.

 







Комментариев: 7

А есть видео работы проги?

Есть на сайте разработчика

Content Downloader версии 6.91 (25.09.2010):

- Доработана функция рассчета дат в отложенной публикации (теперь даты публикаций статей присваеваются к списку документов не по очереди, а в случайном порядке).

Content Downloader версии 6.89 (25.09.2010):

- Теперь, при парсинге контента, папки с изображениями создаются только к тем документам, где содержатся картинки;
- Теперь количество меток (автозаполнение полей) не фиксированное, а рандомное;
- Исправлены и доработаны функции расстановки дат публикации (при создании файлов импорта в Wordpress, Zebrum);
- Теперь парсятся картинки с пробелами и знаком % в имени файла;
- Множество незначительных нововведений, изменений, исправлений и доработок.


Content Downloader версии 6.87 (23.09.2010):

- Исправлен и доработан инструмент задания границ парсинга;
- Слегка изменен интерфейс вкладки контент;

Проверил по Ашманову сайт jivoymir.ru (в примере приведен), Яндекс -0, GOOGLE -39 стр. А у нас вроде как без яндыкса никуды... Как её использовать, чтобы в яндыкс попасть?

Хотя вот сейчас проверил другие два сайта - оба в яндексе. И ГУгле. Интересная программа.

ссылка вот. http://*******v.com/computers/programming/parsing/content-downloader/ бесплатно... между прочим.

Между прочим авторские права никто еще не отменял. И гордиться тем, что у вас на сайте лежит пиратская программа не есть хорошо ...

Комментировать





  • » Тизерная биржа трафика Визард-Тизерс
  • » Деньги на дебетовую карту
  • » Анонс контекстной платформы "ТООР"
  • » Продвижения сайта -- к чему приводит приостановка
  • » Биржа статей "Seo Link"
  • » Wizard Banners - уникальная система медийной рекламы
  • » Movebo - сервис продвижения сайтов в ТОП Яндекса и Google поведенческими факторами
  • » Аналитический обзор рынка FOREX за пятницу, 22 января 2010 года
  • » Плагин Click Tagging для Movable Type
  • » Тизерная сеть IziTizi
  • » Рекламная RTB-сеть Advertur
  • » Биржа мест под статьи "Seo Zavr"
  • » Партнёрская программа по конвертации русского кинотрафика
  • » Exchange links "Link Worth"
  • » Сервис автоматической регистрации в каталогах Autoreg
  • » Система размещения статей "Mira Links"
  • » Обзор счетчиков посещаемости
  • » Биржа Rota Post для блогеров и рекламодателей
  • » CentOS: CGI скрипты в apache 2.0
  • » Что понадобится для того, чтобы сделать сайт
  • » Россияне делают деньги в интернете
  • » Сервис регистрации в англоязычных каталогах
  • » Directadmin: после установки
  • » Партнерская программа Luxury Cash
  • » Партнерская программа для женских сайтов
  • » Биржа банерной рекламы для блогов Rota Ban
  • » Плагин Autolink для Movable Type
  • » Партнерская программа компании Mr.Сумкин
  • » Анонс партнерской программы и хостинга Дата Связи
  • » Биржа сайтов и доменов Telderi
  • » Конференция Whale Rider 2013
  • » Возможность вывода накопленных средств
  • » Пакетная работа с ссылками и сайтами
  • » Терминалы QIWI
  • » Последний анонс в старой версии сайта
  • » Апдейт Google PR 23.06.2009
  • » Пятница... а работа все не кончается...
  • » SEO-аудит от Николая Евдокимова: gurusport.ru
  • » Изменения в параметре «Количество внешних ссылок»
  • » Уникальный мастер-класс от Zappos на конференции «Бизнес интернет-магазинов»
  • » 31 октября в Москве стартует Russian Digital Week
  • » С Новым Годом!
  • » SeoPult - все биржи ссылок в одном флаконе
  • » Новости Nahaa
  • » Качество - превыше всего!
  • » Вирусная реклама: уроки победителей «Каннских львов»-2014
  • » API (XML-RPC)
  • » SEO-учебник для каждого
  • » Обновление скрипта площадки.
  • » Как достичь успеха:10 советов от лидеров западной SEO-индустрии
  • » Новые функции контекстного модуля
  • » Sape на Optimization-2010. Присоединяйтесь!
  • » «FAQ по системе SeoPult», ч. 3
  • » Текстовое ранжирование Яндекса
  • » 1-я выставка ecommerce-технологий откроется через неделю
  • » Как оптимизировать свой бюджет на рекламу в социальных медиа?
  • » Поддержим Яндекс
  • » Аудит от Николая Евдокимова: cайт www.stroyvishka.ru
  • » 5 типичных ошибок, которых следует избегать в интервью для Интернет-изданий
  • » Добавлена возможность ограничения доступа в акканут


Категории


Последние записи

Полезные заметки