Коммерческий директор ООО НПП "Геотек"
Продукт расширяет возможности STATISTICA Data Miner мощными инструментами для анализа неструктурированной текстовой информации.
STATISTICA Text Miner – это дополнительная возможность STATISTICA Data Miner, идеально подходящая для того чтобы переводить неструктурированный текст в легко-читаемую, ценную информацию, пригодную для принятия "золотых" решений. Большинство пользователей, знакомых с системами Text Mining, хорошо знают о том, что, как правило, реальные "необработанные" данные являются не всегда пригодными для восприятия и последующего анализа.
STATISTICA Text Miner позволяет выбрать из потока информации необходимые данные и структурировать их. STATISTICA Text Miner интегрирована в приложение STATISTICA Data Miner и в другие продукты компании StatSoft, отличительной чертой которых является то, что они являются наиболее полными и мощными инструментами на рынке и выполнены с безупречным вниманием как к вопросам увеличения эффективности, так и к вопросам расширения возможностей.
Настоящее приложение использует многопотоковые компьютерные технологии для достижения максимальной производительности передовых многопроцессорных серверных систем.
Также как и все компоненты STATISTICA Data Miner, STATISTICA Text Miner специально разработан как общее средство с открытой архитектурой, предназначенное для добычи данных из потока неструктурированной информации. Особенностью средств Text Mining, а также других аналитических инструментов, доступных в STATISTICA Text Miner , является то, что в качестве входных данных можно использовать не только текстовые документы или веб-страницы, но также ссылки, списки или кластеры.
Анализируемая Вами неструктурированная информация даже может включать в себя непреобразованные битовые изображения, звуковые файлы и т.д.
Программа содержит многочисленные опции для организации доступа к текстовым документам в различных форматах: .txt(текст), .pdf(Adobe), .ps(PostScript) .html, .xml(сетевые форматы) и в большинстве форматов MS Office (таких как .eg, .rtf ).
Удобный пользовательский интерфейс (и автоматизированные функции) предусмотрен для выбора большого числа файлов посредством wild-card (например, для выбора всех документов в одном из подкаталогов иерархической файловой структуры).
Программа поддерживает возможность «Web-crawling», так что документы могут быть доступны по гиперссылке на объемлющий источник в интернете. Таким образом ссылки на интернет-ресурсы для этого приложения ничем не отличаются от ссылок на различные директории или папки в компьютере.
Путь к текстовым документам или URL-ссылки могут являться текстовыми переменными в файлах данных STATISTICA. То есть программа может использовать в своей работе не только фактическую информацию, хранящуюся в текстовых переменных, но также возможна интерпретация ссылок на текстовые документы или URL. Таким образом численная и текстовая информация (большие документы) могут храниться посредством представителя (ссылки) базового множества, и самые разнообразные виды анализа могут быть произведены над файлами данных, где каждой ссылке соответствует большой неструктурированный массив текстовых данных (например возраст пациента, его рост, вес, вместе с комментариями терапевта о состоянии больного).
Опции рассчитаны на гибкий импорт списков имен файлов и URL-ссылок в колонки таблиц STATISTICA.
Документы могут быть предварительно обработаны до того, как будут проиндексированы (фактически эти процессы происходят единовременно).
Также могут быть примененными исключения и стоп-листы (списки слов, не учитываемых приложением; исключается общая, но не детальная диагностика слов, например, таких как "a","to","is","the" в английском языке),а также морфологический алгоритм (таким образом слова "traveled", "traveling" воспринимаются как отдельные случаи слова "travel" в английском языке).
Стоп-листы и морфологические алгоритмы существуют также для Датского, Голландского, Английского, Французского, Немецкого, Итальянского, Португальского, Испанского, Шведского и других языков (необходимо уточнять). Также стоп-листы могут быть пополнены пользователем в случае необходимости. Программа написана так, что поддержка дополнительных языков может быть осуществлена с минимумом затрат.
Далее, программа индексирует документы, прошедшие через морфологический алгоритм и проверку на предмет несоответствия списку стоп-слов для подсчета частоты появления различных слов в различных документах. Эта "сырая информация" используется в качестве основы для различных видов дальнейшего анализа.
Перед созданием файла данных STATISTICA, содержащего численные характеристики (и т.д.), могут быть применены различного рода дополнительные фильтры. Например, частоты появления наименее редких слов могут быть нормализованы (по длине документа), преобразованы (например, прологарифмированы), оптимально сжаты, например, используя алгоритмы выделения различных особенностей, такие как SVD (выявление одиночных значений, алгоритм особенно эффективен в случае наличия редких шаблонов).
Получившийся файл данных, содержащий в себе численные характеристики (например, SVD-объем, недоработанные счетчики, относительные счетчики, счетчики наиболее часто встречающихся слов и т.д.) пригоден для дальнейшего анализа.
Предусмотрены различные опции для записи информации, полученной из текста, во входные файлы или непосредственно во внешние базы данных.
Все средства анализа применимы к численной сводке, являющейся своеобразным резюме представляемого текста.
Простейшие статистики могут извлечь информацию, например, о наиболее общих словах, используемых в документе.
Посредством отображения, сопоставляющего документу его SVD-обЪем (например, посредством PCA), можно оценивать степень похожести документов.
Посредством соответствия, основанного на сопоставлении документам их счетчиков появления различных слов (возможно преобразованных) можно установить принадлежность документа к той или иной смысловой категории.
Кластерные методы (такие как EM, метод k-средних) позволяют идентифицировать группы сходных по смыслу документов.
Предсказательные методы добычи данных позволяют устанавливать связи между полученными численными характеристиками документов с другими представляющими интерес индикаторами (например, намерение ввести в заблуждение, медицинский диагноз и т.д.).
Основные аналитические компоненты, требуя обработки большого числа данных, выполняются посредством привлечения многопотоковых компьютерных технологий для достижения максимума эффективности передовых многопроцессорных систем.
Программное обеспечение для Text Mining полностью интегрируемо с любым другим программным обеспечением, принадлежащим линии продуктов STATISTICA.
Это делает систему для анализа текста уникальной на рынке. Благодаря тому, что приложение полностью интегрируемо (и автоматизировано) система для Text Mining являет собой "другой модуль" так, что может быть интегрировано в окружение STATISTICA Data Miner workspace, STATISTICA Enterprise, или обычные приложения STATISTICA (посредством SVB; например, пользователи могут автоматически и регулярно получать доступ к файлам, расположенным в хранилищах данных, используя IDP технологию; корректировать информацию о точном анализе и численных характеристиках текстовой информации, доступной из хранилища; благодаря интеграцией с WebSTATISTICA (расширение для STATISTICA Enterprise), результаты различных типов анализа могут быть доступны авторизованным пользователям в сети).
|
ИЕСофт - лидер рынка по внедрению российского софта
Более 15-ти лет продаем лицензионное ПО. Провели 100+ обучений. Создали 160+ библиотек для САПР и BIM. Разработали 17 плагинов для проектной и строительной отрасли.
Кибербезопасность. BIM Технологии и СОДЫ. Операционные системы и офисное ПО. Импортозамещение.
ИЕСофт работает для вашего бизнеса!
Тех. поддержка
Экономия средств
Вежливые сотрудники
Наша компания ООО НПП "Геотек" поставила перед собой задачу создания 3D изображений своего оборудовния, которео разрабатывается на базе программы SOLIDWORKS. Для выполнения поставленной задачи было приобретено приложение SOLIDWORKS Visualize.
Для эффективной работы в приложении необходимо было пройти обучение нашему менеджеру по рекламе. Былпроизведен поиск компании, которая смогла бы организовать процесс обучения с учетом нашей специфики и графика работы. По данным критериям подошла компани ООО "ИнфоСАПР".
Во время обучения были использованы 4 варианта освоения материала:
Умение сотрудников IESoft проявить гибкость в оказании услуг заказчику при поставке программных продуктов , а также сделать это в кратчайшие сроки..
АО «НижневартовскНИПИнефть» выражает благодарность коллективу и руководству ООО"ИнфоСАПР" за многолетнее и плодотворное сотрудничество.
Ваша компания зарекомендовала себя как надежный поставщик Программного Обеспечения от различных разработчиков. Ваши специалисты имеют высокий уровень профессионализма и оперативно оказывают помощь в составлении спецификаций на поставку ПО от АО «СиСофт Девелопмент», АО «Нанософт», ООО «НТП Трубопровод» и др. Всегда в кратчайшие сроки консультируют по возникающим вопросам.
Мы благодарим, Вас, за качественную работу и надеемся на дальнейшее взаимовыгодное и плодотворное сотрудничество.
В период с 9 августа 2021 г по 12 августа 2021 г наш специалист по рекламе Белецкая Мария, проходила обучающий курс SolidWorks Visualize Professional 2021 в компании «ИнфоСАПР» (ИнфоСАПР).
Хотелось бы отметить следующие положительные моменты в обучении, а именно: индивидуальный подход - примеры при обучении были взяты из деятельности компании, проведение занятий в удобное время, оказание технической поддержки после прохождения курса.
Компания ООО "Сервис Катализаторных Систем" благодарит ООО "ИнфоСАПР" за высокий уровень работ по поставке программного обеспечения (Autodesk, SolidWorks, Microsoft и т.д.). На протяжении нашего сотрудничества компания ООО "ИнфоСАПР" зарекомендовала себя как надежный деловой партнёр и устойчивое предприятие.
Благодаря главному принципу работы компании - формированию с клиентами партнёрских отношений, основанных на профессионализме, взаимном сотрудничестве и индивидуальном подходе к каждому заказу.
Исходя из вышесказанного, компания ООО "Сервис Катализаторных Систем" хотела бы отметить высокий потенциал ООО "ИнфоСАПР", нацеленность на процветание и дальнейшее успешное развитие.
В компании ИнфоСАПР мы неоднократно приобретали программное обеспечение Autodesk.
Именно в этой компании мы нашли тот уровень лояльности к клиенту, который удовлетворяет нас. Нас утраивает разные варианты оплаты, своевременная консультация в изменениях, которые происходят в программе Autodesk. ИнофСАПР своевременно предупреждает о сроке окончания подписок.
Компания ООО "ИнфоСАПР" является поставщиком программ AutoCAD и SOLIDWORKS. За прошедшее время она зарекомендовала себя, как надежная и клиентоориентированная компания. Искренне надеемся на дальнейшее сотрудничество
Компания ООО "ПНЕВМАКС СИСТЕМЫ" благодарит ООО "ИнфоСАПР" за высокий уровень работ по поставке программного обеспечения Autodesk Inventor Professional, в срок ранее оговоренный.
Хочется отметить умение сотрудников проявить гибкость в оказании услуг, так же поддерживать уровень лояльности, качество работы, оперативность и организованность.
ООО "РивалКом" выражает благодарность компании ООО "ИЕСофт" за своевременную поставку программного обеспечения САПР Solidworks компании Dassault Systemes.
Специалисты компании ООО "ИЕСофт" оперативно проводят консультации с клиентами и стараются подобрать оптимальную конфигурацию программного обеспечения с учетом требований заказчика. В каталоге компании представлен обширный ассортимент программных продуктов, так же ООО "ИЕСофт" обладает партнерскими статусами российских и международных вендоров.
В ходе долгосрочного сотрудничества, сотрудники компании IESoft проявили внимательность к нашим пожеланиям и разумную инициативу.
Сотрудники компании заранее сообщают нам об окончании сроков действия подписки, оперативно решают все возникающие вопросы, а также постоянно держат нас в курсе акция и скидок.
В кратчайшие сроки Сотрудниками IESoft нам была предоставлена исчерпывающая информация об интересующем нас программном обеспечении и коммерческое предложение на него с учетом скидок.
Компания ООО "Пожтехника-проект" благодарит ООО "ИнфоСАПР" за высокий уровень работ по поставке программного обеспечения Autodesk, в срок ранее оговоренный.
Хочется отметить работы, оперативность и организованность сотрудников компании.
Так же компания идет на встречу по оплате, предлагая различные варианты оплаты.
Компания "Реле и Автоматика" выражает благодарность IESoft за плодотворное сотрудничество, а также за своевременное и качественное выполнение работ!
В подарок от компании IESoft мы получили официальную демо-версию программы AutoCAD Inventor. Специалисты "IESoft» показали, что Inventor содержит функционал, необходимый в нашей работе, и предложили нам попробовать эту САПР.
В кратчайшие сроки Сотрудниками IESoft нам была предоставлена исчерпывающая информация об интересующем нас программном обеспечении и коммерческое предложение на него с учетом скидок.
Компания IESoft быстро и грамотно выполнила свои обязательства по поставке продукта. С целью ускорения внедрения продукта в работу компании для нас было организовано обучение.