Продукт расширяет возможности STATISTICA Data Miner мощными инструментами для анализа неструктурированной текстовой информации.

STATISTICA Text Miner – это дополнительная возможность STATISTICA Data Miner, идеально подходящая для того чтобы переводить неструктурированный текст в легко-читаемую, ценную информацию, пригодную для принятия "золотых" решений. Большинство пользователей, знакомых с системами Text Mining, хорошо знают о том, что, как правило, реальные "необработанные" данные являются не всегда пригодными для восприятия и последующего анализа.

Отечественное ПО

STATISTICA Text Miner позволяет выбрать из потока информации необходимые данные и структурировать их. STATISTICA Text Miner интегрирована в приложение STATISTICA Data Miner и в другие продукты компании StatSoft, отличительной чертой которых является то, что они являются наиболее полными и мощными инструментами на рынке и выполнены с безупречным вниманием как к вопросам увеличения эффективности, так и к вопросам расширения возможностей.

Настоящее приложение использует многопотоковые компьютерные технологии для достижения максимальной производительности передовых многопроцессорных серверных систем.

Также как и все компоненты STATISTICA Data Miner, STATISTICA Text Miner специально разработан как общее средство с открытой архитектурой, предназначенное для добычи данных из потока неструктурированной информации. Особенностью средств Text Mining, а также других аналитических инструментов, доступных в STATISTICA Text Miner , является то, что в качестве входных данных можно использовать не только текстовые документы или веб-страницы, но также ссылки, списки или кластеры.

Анализируемая Вами неструктурированная информация даже может включать в себя непреобразованные битовые изображения, звуковые файлы и т.д.


Функциональное ядро STATISTICA Text Miner

Доступ к документам

  1. Программа содержит многочисленные опции для организации доступа к текстовым документам в различных форматах: .txt(текст), .pdf(Adobe), .ps(PostScript) .html, .xml(сетевые форматы) и в большинстве форматов MS Office (таких как .eg, .rtf ).

  2. Удобный пользовательский интерфейс (и автоматизированные функции) предусмотрен для выбора большого числа файлов посредством wild-card (например, для выбора всех документов в одном из подкаталогов иерархической файловой структуры).

  3. Программа поддерживает возможность «Web-crawling», так что документы могут быть доступны по гиперссылке на объемлющий источник в интернете. Таким образом ссылки на интернет-ресурсы для этого приложения ничем не отличаются от ссылок на различные директории или папки в компьютере.

  4. Путь к текстовым документам или URL-ссылки могут являться текстовыми переменными в файлах данных STATISTICA. То есть программа может использовать в своей работе не только фактическую информацию, хранящуюся в текстовых переменных, но также возможна интерпретация ссылок на текстовые документы или URL. Таким образом численная и текстовая информация (большие документы) могут храниться посредством представителя (ссылки) базового множества, и самые разнообразные виды анализа могут быть произведены над файлами данных, где каждой ссылке соответствует большой неструктурированный массив текстовых данных (например возраст пациента, его рост, вес, вместе с комментариями терапевта о состоянии больного).

  5. Опции рассчитаны на гибкий импорт списков имен файлов и URL-ссылок в колонки таблиц STATISTICA.

Обработка данных

  1. Документы могут быть предварительно обработаны до того, как будут проиндексированы (фактически эти процессы происходят единовременно).

  2. Также могут быть примененными исключения и стоп-листы (списки слов, не учитываемых приложением; исключается общая, но не детальная диагностика слов, например, таких как "a","to","is","the" в английском языке),а также морфологический алгоритм (таким образом слова "traveled", "traveling" воспринимаются как отдельные случаи слова "travel" в английском языке).

  3. Стоп-листы и морфологические алгоритмы существуют также для Датского, Голландского, Английского, Французского, Немецкого, Итальянского, Португальского, Испанского, Шведского и других языков (необходимо уточнять). Также стоп-листы могут быть пополнены пользователем в случае необходимости. Программа написана так, что поддержка дополнительных языков может быть осуществлена с минимумом затрат.

  4. Далее, программа индексирует документы, прошедшие через морфологический алгоритм и проверку на предмет несоответствия списку стоп-слов для подсчета частоты появления различных слов в различных документах. Эта "сырая информация" используется в качестве основы для различных видов дальнейшего анализа.

  5. Перед созданием файла данных STATISTICA, содержащего численные характеристики (и т.д.), могут быть применены различного рода дополнительные фильтры. Например, частоты появления наименее редких слов могут быть нормализованы (по длине документа), преобразованы (например, прологарифмированы), оптимально сжаты, например, используя алгоритмы выделения различных особенностей, такие как SVD (выявление одиночных значений, алгоритм особенно эффективен в случае наличия редких шаблонов).

  6. Получившийся файл данных, содержащий в себе численные характеристики (например, SVD-объем, недоработанные счетчики, относительные счетчики, счетчики наиболее часто встречающихся слов и т.д.) пригоден для дальнейшего анализа.

  7. Предусмотрены различные опции для записи информации, полученной из текста, во входные файлы или непосредственно во внешние базы данных.

Анализ

Все средства анализа применимы к численной сводке, являющейся своеобразным резюме представляемого текста.

  1. Простейшие статистики могут извлечь информацию, например, о наиболее общих словах, используемых в документе.

  2. Посредством отображения, сопоставляющего документу его SVD-обЪем (например, посредством PCA), можно оценивать степень похожести документов.

  3. Посредством соответствия, основанного на сопоставлении документам их счетчиков появления различных слов (возможно преобразованных) можно установить принадлежность документа к той или иной смысловой категории.

  4. Кластерные методы (такие как EM, метод k-средних) позволяют идентифицировать группы сходных по смыслу документов.

  5. Предсказательные методы добычи данных позволяют устанавливать связи между полученными численными характеристиками документов с другими представляющими интерес индикаторами (например, намерение ввести в заблуждение, медицинский диагноз и т.д.).

  6. Основные аналитические компоненты, требуя обработки большого числа данных, выполняются посредством привлечения многопотоковых компьютерных технологий для достижения максимума эффективности передовых многопроцессорных систем.


Интеграция со STATISTICA, STATISTICA Data Miner, STATISTICA Enterprise

Программное обеспечение для Text Mining полностью интегрируемо с любым другим программным обеспечением, принадлежащим линии продуктов STATISTICA.

Это делает систему для анализа текста уникальной на рынке. Благодаря тому, что приложение полностью интегрируемо (и автоматизировано) система для Text Mining являет собой "другой модуль" так, что может быть интегрировано в окружение STATISTICA Data Miner workspace, STATISTICA Enterprise, или обычные приложения STATISTICA (посредством SVB; например, пользователи могут автоматически и регулярно получать доступ к файлам, расположенным в хранилищах данных, используя IDP технологию; корректировать информацию о точном анализе и численных характеристиках текстовой информации, доступной из хранилища; благодаря интеграцией с WebSTATISTICA (расширение для STATISTICA Enterprise), результаты различных типов анализа могут быть доступны авторизованным пользователям в сети).

Свернуть подробное описание

Все варианты лицензий
STATISTICA Text Miner

Тип лицензии
Тип покупки
Язык
STATISTICA Text Miner
1
+
0 руб.
Консультация
 шт. 
Перейти в корзину
Получить КП
Язык:   Мультиязычный
Тип лицензии:   Локальная, Постоянная
Срок поставки:   5-7 дней
Тип доставки:   Электронная (email)
Тип покупки:   Новая лицензия
НДС: Поставляется без НДС
Примечание:  Цена по запросу

ИЕСофт - лидер рынка по внедрению российского софта

Более 15-ти лет продаем лицензионное ПО. Провели 100+ обучений. Создали 160+ библиотек для САПР и BIM. Разработали 17 плагинов для проектной и строительной отрасли.

Кибербезопасность. BIM Технологии и СОДЫ. Операционные системы и офисное ПО. Импортозамещение.

ИЕСофт работает для вашего бизнеса!


Почему более 10 000 клиентов
выбрали ИЕСофт?

Тех. поддержка

Тех. поддержка

Экономия средств

Экономия средств

Вежливые сотрудники

Вежливые сотрудники

Нас выбирают, когда нужен
проверенный софт за лучшую цену

ООО НПП "Геотек"
Самодина С.В.

Коммерческий директор ООО НПП "Геотек"

Наша компания ООО НПП "Геотек" поставила перед собой задачу создания 3D изображений своего оборудовния, которео разрабатывается на базе программы SOLIDWORKS. Для выполнения поставленной задачи было приобретено приложение SOLIDWORKS Visualize. 

Для эффективной работы в приложении необходимо было пройти обучение нашему менеджеру по рекламе. Былпроизведен поиск компании, которая смогла бы организовать процесс обучения с учетом нашей специфики и графика работы. По данным критериям подошла компани ООО "ИнфоСАПР".

Во время обучения были использованы 4 варианта освоения материала:

  • презентация;
  • работа в Visualize на примерах заказчика;
  • теоретические вопросы по пройденному материалу в коцне каждого дня обучения;
  • практическая часть с заданиями.

ООО "Югтерминалпроект"
Шкуро С.А.

Заместитель генерального директора по производству ООО "Югтерминалпроект"

Умение сотрудников IESoft проявить гибкость в оказании услуг заказчику при поставке программных продуктов , а также сделать это в кратчайшие сроки..

АО «НижневартовскНИПИнефть»
С.Ю. Солдатов
Генеральный директор АО «НижневартовскНИПИнефть»

АО «НижневартовскНИПИнефть» выражает благодарность коллективу и руководству ООО"ИнфоСАПР" за многолетнее и плодотворное сотрудничество. 

Ваша компания зарекомендовала себя как надежный поставщик Программного Обеспечения от различных разработчиков. Ваши специалисты имеют высокий уровень профессионализма и оперативно оказывают помощь в составлении спецификаций на поставку ПО от АО «СиСофт Девелопмент», АО «Нанософт», ООО «НТП Трубопровод» и др. Всегда в кратчайшие сроки консультируют по возникающим вопросам. 

Мы благодарим, Вас, за качественную работу и надеемся на дальнейшее взаимовыгодное и плодотворное сотрудничество. 

ООО НПП "Геотек"
С.В. Самодина
Коммерческий директор 

В период с 9 августа 2021 г по 12 августа 2021 г наш специалист по рекламе Белецкая Мария, проходила обучающий курс SolidWorks Visualize Professional 2021 в компании «ИнфоСАПР» (ИнфоСАПР).

Хотелось бы отметить следующие положительные моменты в обучении, а именно: индивидуальный подход - примеры при обучении были взяты из деятельности компании, проведение занятий в удобное время, оказание технической поддержки после прохождения курса.

ООО "Сервис Катализаторных Систем"
Челышев Н.А.
Генеральный директор ООО "Сервис Катализаторных Систем"

Компания ООО "Сервис Катализаторных Систем" благодарит ООО "ИнфоСАПР" за высокий уровень работ по поставке программного обеспечения (Autodesk, SolidWorks, Microsoft и т.д.). На протяжении нашего сотрудничества компания ООО "ИнфоСАПР" зарекомендовала себя как надежный деловой партнёр и устойчивое предприятие.

Благодаря главному принципу работы компании - формированию с клиентами партнёрских отношений, основанных на профессионализме, взаимном сотрудничестве и индивидуальном подходе к каждому заказу.

Исходя из вышесказанного, компания ООО "Сервис Катализаторных Систем" хотела бы отметить высокий потенциал ООО "ИнфоСАПР", нацеленность на процветание и дальнейшее успешное развитие.

ООО "Проект СПиЧ"
Воронин А.И.
Руководитель службы системного обеспечения
Компания ООО Проект СПиЧ благодарит ООО ИнфоСАПР за высокий уровень работ по поставке программного обеспечения таких производителей как Аutodesk, Adobe и других вендоров.

Хочется отметить умение сотрудников проявить гибкость в оказании услуг, так же поддерживать уровень лояльности, высокое качество работы, оперативность и организованность. Мы рекомендуем компанию ООО ИнфоСАПР, как надежного поставщика программного обеспечения.
ООО "Строительная компания КаскадСтрой"
Шпак В.В.
Генеральный директор ООО "Строительная компания КаскадСтрой"

В компании ИнфоСАПР мы неоднократно приобретали программное обеспечение Autodesk.
Именно в этой компании мы нашли тот уровень лояльности к клиенту, который удовлетворяет нас. Нас утраивает разные варианты оплаты, своевременная консультация в изменениях, которые происходят в программе Autodesk. ИнофСАПР своевременно предупреждает о сроке окончания подписок.

ООО "Горные технологии"
Пирожков А.Р.
Генеральный директор ООО "Горные технологии"

Компания ООО "ИнфоСАПР" является поставщиком программ AutoCAD и SOLIDWORKS. За прошедшее время она зарекомендовала себя, как надежная и клиентоориентированная компания. Искренне надеемся на дальнейшее сотрудничество

ООО "ПНЕВМАКС СИСТЕМЫ"
Тананаев П.А.
Главный конструктор ООО "ПНЕВМАКС СИСТЕМЫ"

Компания ООО "ПНЕВМАКС СИСТЕМЫ" благодарит ООО "ИнфоСАПР" за высокий уровень работ по поставке программного обеспечения Autodesk Inventor Professional, в срок ранее оговоренный.

Хочется отметить умение сотрудников проявить гибкость в оказании услуг, так же поддерживать уровень лояльности, качество работы, оперативность и организованность.

ООО "РивалКом"
Шакиров Р.М.
Генеральный директор ООО "РивалКом"

ООО "РивалКом" выражает благодарность компании ООО "ИЕСофт" за своевременную поставку программного обеспечения САПР Solidworks компании Dassault Systemes.

Специалисты компании ООО "ИЕСофт" оперативно проводят консультации с клиентами и стараются подобрать оптимальную конфигурацию программного обеспечения с учетом требований заказчика. В каталоге компании представлен обширный ассортимент программных продуктов, так же ООО "ИЕСофт" обладает партнерскими статусами российских и международных вендоров.

ООО "ПСК ФАРВАТЕР"
Богданов А.А.
Генеральный директор ООО "ПСК ФАРВАТЕР"

В ходе долгосрочного сотрудничества, сотрудники компании IESoft проявили внимательность к нашим пожеланиям и разумную инициативу.

ООО "ИнжЦентрПроект"
Морозов Д.И.

Генеральный директор ООО "ИнжЦентрПроект"

Сотрудники компании заранее сообщают нам об окончании сроков действия подписки, оперативно решают все возникающие вопросы, а также постоянно держат нас в курсе акция и скидок.

ООО "Систел Автоматизация"
Климахин М. А.
Инженер-конструктор ООО "Систел Автоматизация"

В кратчайшие сроки Сотрудниками IESoft нам была предоставлена исчерпывающая информация об интересующем нас программном обеспечении и коммерческое предложение на него с учетом скидок.

ООО "Пожтехника-проект"
Курбатов Р.Р.
Генераньный директор ООО "Пожтехника-проект"

Компания ООО "Пожтехника-проект" благодарит ООО "ИнфоСАПР" за высокий уровень работ по поставке программного обеспечения Autodesk, в срок ранее оговоренный.

Хочется отметить работы, оперативность и организованность сотрудников компании.

Так же компания идет на встречу по оплате, предлагая различные варианты оплаты.

ООО Электротехническая компания "Флавир"
Назаров Д.В.
Генеральный директор ООО Электротехническая компания "Флавир"
Сотрудники компании IESoft отнеслись ответственно к нашему заказу и выполнили работу профессионально и в сроки, оговоренные в договорах. Особенно надо отметить, что в ходе выполнения работ были проявлены инициативность и внимательность к нашим пожеланиям.

ООО "Реле и Автоматика"
Абрамов М.Б.

Генеральный директор ООО "Реле и Автоматика"

Компания "Реле и Автоматика" выражает благодарность IESoft за плодотворное сотрудничество, а также за своевременное и качественное выполнение работ!

ЗАО "Южполиметалл-Холдинг"
Шабля О.В.
Руководитель группы рентгенотехники ЗАО "Южполиметалл-Холдинг"

В подарок от компании IESoft мы получили официальную демо-версию программы AutoCAD Inventor. Специалисты "IESoft» показали, что Inventor содержит функционал, необходимый в нашей работе, и предложили нам попробовать эту САПР.

ООО "ПМТиК"
Мельников Ю. П.
Главный конструктор ООО "ПМТиК"

В кратчайшие сроки Сотрудниками IESoft нам была предоставлена исчерпывающая информация об интересующем нас программном обеспечении и коммерческое предложение на него с учетом скидок.

ЗАО "Оргрегионпроект"
Осколков Н.С.
Начальник отдела АСУ ТП и КИПиА ЗАО "Оргрегионпроект"
Специалисты IESoft действительно не останавливаются только на продаже - при возникновении проблем с программным обеспечением, даже спустя длительное время - быстро приходят на помощь и решают проблему, в этом мы убедились на собственном опыте.
Группа компаний "Спектрум"
Мазаев П.А.
Генеральный директор группы компаний "Спектрум"

Компания IESoft быстро и грамотно выполнила свои обязательства по поставке продукта. С целью ускорения внедрения продукта в работу компании для нас было организовано обучение.

Получить консультацию
Запросить КП

Подбор программ по задаче

Игры и развлечения
Облачные продукты
Сметное дело
Геоинформационные системы
Кадастр и Недвижимость
ГОСТы и нормативы
Видеонаблюдение

Подбор программ по отраслям