Понедельник, 06.05.2024, 03:44
Приветствую Вас Гость | RSS
Главная » 2012 » Август » 13 » Basegroup
23:36

Basegroup





Термины на букву F

Критерий Фишера

Синонимы: F-критерий

Критерий для оценки значимости различия дисперсий двух случайных выборок. Для этого вычисляется F-статистика, равная F = D1/D2, где D1 – большая дисперсия, D2 – меньшая дисперсия. Если полученное значение F-статистики больше критического для определенного уровня значимости и соответствующих чисел степеней свободы для числителя и знаменателя, то дисперсии считаются значимо различающимися. В Data Mining применяется для оценки значимости регрессионных моделей.

Факт

Синонимы: Мера, Показатель, Measure

В многомерном моделировании данных это показатель (признак, атрибут), количественно описывающий исследуемый процесс или объект, например, цена, количество, сумма, остаток на складе и т.д.

В многомерных структурах данных факты образуют отдельную таблицу, которая так и называется «таблица фактов». С ней соединены все таблицы измерений. Любой факт ассоциирован с некоторым измерением. Например, информация о цене не имеет смысла, если она не связана с определенным товаром, продуктом, работой или услугой.

Факты бывают аддитивные, неаддитивные и полуаддитивные. Аддитивными называются факты, которые можно суммировать в разрезе всех измерений, имеющихся в многомерной модели, например, сумма проданных товаров. Полуаддитивные факты – это те, которые можно суммировать в разрезе не всех, а только некоторых измерений. Примером таковых является остаток на складе (который нельзя суммировать в разрезе времени). Неаддитивные факты – факты, которые нельзя суммировать, например, процентные доли.

В многомерном моделировании вместо термина «факт» часто используют другой термин – мера (measure). Поэтому в данной области и термины могут рассматриваться как синонимы.

Фактор

Источник воздействия, приводящего к изменению значений переменных модели некоторой системы; движущая сила какого-либо процесса или явления. Часто термины «фактор» и «переменная» (признак, показатель) отождествляются, что не всегда справедливо.

Факторный анализ

Направление математической статистики (один из разделов многомерного статистического анализа), объединяющее вычислительные методы, которые в ряде случаев позволяют получить компактное описание исследуемых явлений на основе обработки больших массивов информации.

От других средств подобного "сжатия информации" (например, распространенных методов статистической группировки объектов) факторный анализ отличается тем, что не опирается на заранее заданный, априорный перечень факторов, влияющих на исследуемые процессы или объекты, а наоборот, при соблюдении определенных правил и предосторожностей помогает обнаружить наиболее важные из них, причем скрытые (латентные).

Например, аналитик непосредственно наблюдает за множеством различных показателей деятельности предприятий, чтобы выявить закономерности, влияющие на рост производительности труда (уровень квалификации персонала, коэффициент сменности оборудования, электровооруженность труда, "возраст" оборудования, количество мест в столовых и т. д.). Так или иначе, все факторы, описываемые этими показателями, воздействуют на изучаемый – производительность труда. При этом многие из них связаны между собой, отражая с разных сторон по существу одни и те же явления. С помощью приемов функционального анализа этих связей (корреляций) удается обнаружить, что на самом деле решающее влияние на рост производительности труда оказывает лишь несколько обобщенных факторов (напр., размер предприятия, уровень организации труда, характер продукции), непосредственно не наблюдавшихся при исследовании. Собственно это их действие и проявляется в учитываемых показателях. Задача состоит в том, чтобы выявить скрытые обобщенные факторы, которые в достаточной для данного исследования степени объясняют изменения изучаемого показателя.

Выявленные факторы позволяют строить аналитические модели с относительно небольшим числом переменных, что упрощает их реализацию и интерпретацию пользователем, снижает вычислительные затраты и время, требуемое на получение решений, а следовательно, повышает оперативность принятия решений на основе результатов анализа.

Ложный аттрактор

Синонимы: Химера, Ложный образ, Перекрестная ассоциация, False pattern, Cross-association

Состояние нейронной сети Хопфилда, которое является устойчивым, но не дает правильного восстановления образа. При этом сеть может выдать ложный образ (часто называемый химерой), который обычно представляет собой комбинацию фрагментов нескольких образов, хранимых ею (перекрестная ассоциация).

Дальнее скрещивание

Метод создания родительских пар при реализации генетических алгоритмов, в котором учитывается расстояние между особями. В самом простом случае это будет расстояние в хемминговом пространстве генотипа. При этом скрещиваются особи, находящиеся на максимальной дистанции друг от друга. Использование такого оператора позволяет генетическому алгоритму быстрее анализировать всю поверхность решений задачи.

Тест FASMI

Синонимы: Быстрый анализ разделяемой многомерной информации, FASMI

Определение понятия OLAP в виде пяти критериев, которым должны удовлетворять продукты, попадающие в эту категорию. Они впервые были сформулированы в начале 1995 г.

  • FAST (Быстрый) – означает, что система должна обеспечивать выдачу большинства ответов пользователям в сжатые сроки. При этом самые простые запросы обрабатываются в течение одной секунды и очень немногие – более 20-ти.
  • ANALYSIS (Анализ) – означает, что система может справляться с любым логическим и статистическим анализом, характерным для данного приложения, и обеспечивает его сохранение в виде, доступном для конечного пользователя.
  • SHARED (Разделяемый) – означает, что система осуществляет все требования защиты конфиденциальности (возможно до уровня ячейки) и, если множественный доступ для записи необходим, обеспечивает блокировку модификаций на соответствующем уровне.
  • MULTIDIMENSIONAL (Многомерный) – означает, что система должна обеспечить многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий. Многомерность является ключевым критерием.
  • INFORMATION (Информация) – требуемая информация должна быть получена там, где она необходима.

Тест FASMI был разработан в качестве альтернативы известным 18-ти правилам Кодда, определяющим OLAP-систему.

Нейронная сеть с прямой связью

Синонимы: Прямопоточная нейронная сеть, Статическая сеть

Нейронная сеть с прямой связью распространяет сигналы от выходов предшествующих слоев к входам последующих.

Обратная связь

В кибернетике это вид соединения элементов, означает связь между выходом какого-либо элемента и входом того же самого элемента, осуществляемую непосредственно или через другие элементы системы. Принцип обратной связи универсален, он лежит в основе функционирования автоматически регулируемых систем в природе, технике, экономике и других областях. При передаче части выходного сигнала всей системы на ее вход образуется главная или внешняя обратная связь. Внутренние или местные обратные связи соединяют выход отдельных элементов или групп последовательно включенных элементов с их входом. Положительная обратная связь усиливает действие входного сигнала (имеет с ним одинаковый знак), отрицательная - ослабляет (имеет знак, противоположный знаку входного сигнала). Положительная обратная связь ухудшает устойчивость системы, отрицательная - способствует восстановлению равновесия в системе при его нарушении возмущающими воздействиями.

Фильтрация

В отличие от задачи оценивания параметров, имеющих фиксированные, хотя и неизвестные значения, в задаче фильтрации требуется исследовать процессы, то есть находить текущие оценки изменяющегося во времени скалярного или векторного сигнала U(t), искаженного помехой и в силу этого недоступного непосредственному наблюдению. Термин «фильтрация» используется лишь при получении оценки текущего значения U(t). Задачу получения оценки будущих или прошлых значений сигнала называют соответственно задачей прогноза или интерполяции. Конкретный вид алгоритмов, используемых для решения задачи фильтрации, зависит от статистических свойств сигнала и помехи. Оценку текущих значений процесса можно осуществить или на основе байесовского принципа или по методу наименьших квадратов.

Распределение Фишера

Синонимы: F-распределение

Если имеются две случайные величины X и Y, подчиняющиеся закону распределения хи-квадрат (Пирсона) со степенями свободы a и b, то отношение (X/a)/(Y/b) называется распределением Фишера или f-распределением с числом степеней свободы a и b. Оно применяется для проверки статистических гипотез, в частности при оценке значимости регрессионных моделей.

Приспособленность

Синонимы: Фитнесс

Термин относится к генетическим алгоритмам.

Параметр, определяющий, насколько хорошо данная особь отвечает требованиям. Она рассчитывается для каждой особи на основе данных, закодированных в генотипе, и используется для выбора наиболее приспособленных из них.

Критерий согласия

Статистическое правило, по которому принимается или отвергается статистическая гипотеза о том, что исследуемая случайная величина подчиняется заданному эмпирическому закону распределения, построенному на основе наблюдений, имеющихся в распоряжении исследователя.

Закон, на соответствие которому проверяется эмпирическое распределение, называют гипотетическим. Задача заключается в проверке соответствия эмпирического и гипотетического законов распределения. При этом выдвигаются две статистические гипотезы: нулевая и альтернативная. Первая утверждает, что различие между эмпирическим и гипотетическим законами (например нормальным) значимо и, следовательно, рассматриваемую случайную величину с большой вероятностью нельзя считать нормально распределенной. Вторая же предполагает отсутствие значимых отличий, а значит и согласованности эмпирического и гипотетического распределений. Таким образом, критерий согласия, как и другие статистические критерии, должен подтвердить или отвергнуть нулевую гипотезу.

Задача проверки соответствия эмпирических распределений гипотетическим очень важна. Выдвигая гипотезу о согласии нашего эмпирического распределения известному гипотетическому, исследователь фактически выбирает статистическую модель исследуемого процесса, которую он будет использовать при его анализе. Если, например, критерий покажет, что закон распределения, построенный по наблюдаемым значениям исследуемой величины, согласуется с нормальным, то можно считать, что она является нормально распределенной. Это очень важно при применении статистических методов анализа, поскольку во многих из них используется предположение о нормальности распределения исследуемых величин (например, линейная и логистическая регрессии, байесовская классификация и т.д.).

В статистике применяется большое количество различных критериев согласия. Среди них наиболее популярными являются критерии хи-квадрат Пирсона, Колмогорова-Смирнова, t-критерий Стьюдента и др.

Метод фокус-групп

Технология сбора информации с использованием групповой дискуссии под руководством специалиста (модератора). Основным достоинством данного метода является возможность оперативного получения так называемой глубинной информации в небольшой группе респондентов. Количество участников группы обычно составляет от 8 до 12 человек. В качестве критериев отбора участников используются пол, возраст, уровень доходов и т.д.

Суть метода заключается в том, что внимание участников фокусируется на исследуемой проблеме (теме), с целью определить отношение к поставленной проблеме, выяснить мотивацию тех или иных действий. Кроме этого, данный метод позволяет заказчику наблюдать за ходом проведения исследования и делать соответствующие выводы.

Стоимость исследования с помощью фокус-группы относительно невелика. Метод может применяться в сочетании с другими методами (как количественными, так и качественными) и как самостоятельный метод сбора информации.

В отличие от количественных методов исследования (например, социологического опроса), которые дают ответ на вопросы ‘Кто?’ и ‘Сколько?’, метод фокус-группа дает ответы на вопросы ‘Как именно?’ и ‘Почему?’ Другой особенностью является способ формирования выборки и методы сбора информации. В социологическом (количественном) исследовании базовым методом является опрос (личный, телефонный), при котором респондентов, представляющих определенную категорию потребителей, опрашивают по единой схеме (анкете). В фокус-группе (качественном исследовании) применяются методы глубинного группового интервью, позволяющие «вытащить» из респондента информацию, не лежащую на поверхности, показывающую широкий спектр отношений к проблеме.

Метод фокус-групп является субъективным методом исследования, в отличие от социологического исследования, которое является объективным методом сбора и обработки информации. Чаще всего фокус-группы используются для генерирования идей, проверки гипотез для количественных исследований, интерпретация результатов количественных исследований, изучения особенностей поведения отдельных групп людей и т.д.

Прогноз

Обоснованное суждение о возможном состоянии исследуемого процесса в будущем или альтернативных путях и сроках достижения этих состояний. В экономике, бизнесе и управлении прогнозы являются одним из важнейших составляющих принятия решений и планирования.

По срокам прогнозы делятся на оперативные (до 1 месяца), краткосрочные (от 1 месяца до 1 года), среднесрочные (1 – 5 лет), долгосрочные (5 – 15 лет) и дальносрочные (15 лет и более). Данная классификация обычно используется для социальных, экономических, научно-технических и бизнес-объектов. При планировании в масштабах экономики страны принято несколько другое деление: оперативно-календарное (до 1 месяца), текущее (от 1 месяца до 1 года), перспективное (1 – 5 лет) и долгосрочное (5 – 15 лет).

Прогнозирование является одной из важнейших задач аналитических технологий Data Mining, а комплекс методов и алгоритмов для построения моделей прогнозов, таких как нейронные сети, деревья решений, регрессия, является типичной составляющей большинства аналитических платформ.

Глубина прогноза

Синонимы: Глубина погружения

Временной интервал из прошлого, выраженный в единицах прогноза (днях, месяцах, кварталах и т.д.), на основе наблюдений которого делается прогноз. Например, если мы хотим построить прогноз на VI квартал, используя данные за I, II и III кварталы, то глубина составит 3, а горизонт будет равен 1.

Вообще, чем больше исходных данных используется для построения модели, тем лучше. Иными словами, можно предположить, что чем больше прошлых наблюдений мы будем применять для построения предсказывающей модели, тем она будет точнее. Но при выборе глубины прогноза это не совсем так, поскольку слишком «старые» данные могли утратить свою актуальность и не отражают современных тенденций и закономерностей исследуемого процесса. Поэтому ее следует выбирать в пределах периода актуальности.

Задание на прогноз

Документ, определяющий цели и задачи прогноза и регламентирующий порядок его разработки. Как правило, он содержит основание для создания прогноза (распоряжение, приказ и т. д.), определение объекта прогнозирования и его основных характеристик, параметров прогноза (горизонта прогнозирования, точности), организационных мероприятий (сбора информации, создания экспертной комиссии), сведения о финансировании и материальном обеспечении, координационный план, основные этапы разработки прогноза и т. д.

Верификация прогноза

Совокупность методов и процедур, направленных на определение достоверности (т.е. вероятности осуществления) прогноза и его точности (т.е. ожидаемой величины отклонения прогнозируемых показателей от реальных).

Различают априорную, апостериорную и верификацию соответствия прогноза. Первая и вторая проводятся соответственно до и после достижения горизонта прогнозирования и позволяют оценить, оправдался или не оправдался прогноз. Третья оценка проводится для установления адекватности прогностической модели и корректности методов ее построения.

Можно выделить восемь основных методов верификации прогноза:

  • прямой - строится альтернативная модель, а потом анализируется, насколько ее результаты отличаются от первоначальной;
  • косвенный - производится сравнение с прогнозами, полученными на основе альтернативных источников информации;
  • инверсный - проверка адекватности прогнозной модели на основе ретроспекции;
  • консеквентный - аналитический или логический вывод прогноза из ранее полученных прогнозов;
  • повторного опроса - повторная экспертиза с учетом дополнительной информации;
  • оппонирования - опровержение критических замечаний экспертов, оппонирующих прогнозу;
  • учета ошибок - выявление и учет источников ошибок прогнозирования;
  • альтернативной экспертизы - сравнение с мнением наиболее компетентных экспертов.

Верификация является необходимым шагом на пути принятия решений на основе прогноза. Большинство аналитических системы Data Mining открывают реальные возможности для верификации прогнозов. В частности, они содержат средства ретроспекции, позволяют строить альтернативные модели и источники информации.

Прогнозирование

Задачи прогнозирования решаются в самых разнообразных областях человеческой деятельности, таких как наука, экономика, производство и множество других сфер.

Прогнозирование (от греческого Prognosis) в широком понимании этого слова определяется как опережающее отражение будущего. Целью прогнозирования является предсказание будущих событий.

Само понятие прогнозирования не имеет четко очерченных границ и активно взаимодействует со смежными задачами анализа данных. Одно из определений прогнозирования было дано Г. Тейлом: «некоторое суждение относительно неизвестных, особенно будущих, событий».

Прогнозирование является одной из задач Data Mining и одновременно одним из ключевых моментов при принятии решений.

Прогнозирование направлено на определение тенденций динамики конкретного объекта или события на основе ретроспективных данных, т.е. анализа его состояния в прошлом и настоящем. Таким образом, решение задачи прогнозирования требует некоторой обучающей выборкой данных.

Прогнозирование - установление функциональной зависимости между зависимыми и независимыми переменными.

Примеры задач: прогноз спроса, прогноз движения денежных средств, прогнозирование урожайности агрокультуры, прогнозирование финансовой устойчивости предприятия, прогнозирование риска возникновения аварии.

Ключ внешний

Понятие теории реляционных баз данных. Представляет собой поле некоторой таблицы, в котором хранятся значения первичного ключа другой таблицы с целью организации связи между ними. Пусть, например, имеются таблицы A и B. Первая содержит поля a, b, c, d, где a – первичный ключ, а вторая содержит поля x, y, z, где в y содержатся значения a для каждой записи из A. В таком случае y и называется внешним ключом для A в B.

Внешний ключ в таблице может ссылаться и на нее саму. В таких случаях его называют рекурсивным. Эти ключи используются для хранения древовидной структуры данных в реляционной таблице.

Фрактал

Объект, в котором его части некоторым образом связаны с целым, то есть отдельные компоненты являются "самоподобными" при любом увеличении. Примером может быть ветвление дерева. Каждая ветвь и последующие ветвления различны, но все они имеют качественное сходство с деревом в целом.

Мошенничество

В широком смысле - обман или злоупотребление доверием с целью завладения чужим имуществом либо правом на чужое имущество (собственность или деньги). В аналитических технологиях данное понятие обычно связывают с мошенническими действиями в области кредитования, использования банковских карт, телекоммуникациях, и других сферах, в которых они могут быть выявлены посредством интеллектуального анализа данных.

Обнаружение фактов мошенничества основано на том, что, как правило, с ним связано некоторое событие, являющееся нетипичным для данного процесса, несоответствующим определенному шаблону. Например, для каждого клиента, пользующегося кредитной картой, банк может составить схему, которая отражает типичный характер его расходов. Если произойдет событие, которое не укладывается в эту схему, скажем, крупное единовременное снятие средств со счета нехарактерное для клиента, то оно может рассматриваться как подозрительное в смысле возможности мошенничества.

В настоящее время в различных направления бизнеса, особенно кредитно-финансовой, получили широкое распространение различные алгоритмы и методы выявления мошенничеств, основанные на аналитических технологиях Data Mining и машинном обучении. При этом используются такие мощные средства анализа как нейронные сетей, деревья решений, последовательные шаблоны и др.

Выявление мошенничеств

Направление интеллектуального анализа данных, включающее комплекс методов выявления мошенничеств. Широко применяется в кредитно-финансовой сфере, телекоммуникациях и др. областях, где возможны незаконные манипуляции со счетами клиентов, изменением тарификации и т.д.

Обычно методика выявления мошенничеств основана на обнаружении событий, не укладывающихся в определенную схему или шаблон, характерный для данного бизнес-процесса или клиента, не соответствующие его закономерностям и тенденциям. Например, клиент телекоммуникационной компании в среднем ежемесячно тратил со своего счета определенную сумму на оплату телефонных разговоров и других услуг компании. Поэтому если в какой-то момент со счета была единовременно снята сумма, в несколько раз превышающая обычную, это событие выглядит подозрительным и требующим проверки.

Для построения систем выявления мошенничеств широко используются аналитические методы Data Mining: нейронные сети, деревья решений, ассоциативные правила, последовательные шаблоны и др.

Система борьбы с мошенничествами

Системы, предназначенные для пресечения и упреждения случаев мошеннических действий. Они интегрируются в информационную систему компании для сбора данных в различных точках с целью ее последующего анализа.

Ядром таких систем является аналитический модуль, осуществляющий непрерывный мониторинг поступающей информации с целью выявления подозрительных наблюдений, которые могут являться следствием мошеннических действий (например, фактов неоплаченного использования услуг сотового оператора). Результаты мониторинга и анализа представляются в виде графиков, диаграмм, отчетов, которые выводятся на единую панель управления и контроля.

Кроме этого, в функцию таких систем может входить автоматическое принятие мер, направленных на предотвращение или прекращения мошеннических действий, минимизацию потерь от них. Например, блокировка банковского счета, отключение абонента, несанкционированно пользующегося услугами, и т.д.

Таблица частот

Простейший метод анализа категориальных переменных. Наиболее часто используется в рамках разведочного анализа с целью определить общий характер распределения данных в выборке. Обычно в таких таблицах представляют частоты, кумулятивные частоты, а также проценты и кумулятивные проценты.

Рассмотрим в качестве примера результаты опроса 100 респондентов, которым был задан вопрос "Покупаете ли вы товары в нашем магазине?", представленные в виде таблицы частот:

Практически любой аналитический проект начинается с построения таблиц частот. Например, в медицинских исследованиях пациентов табулируют по определенным симптомам (температуре), в маркетинге – покупательский спрос по категориям товаров, в производстве – по частоте выхода из строя частей машин и т.д.

Частотная область

Срез фазовой плоскости сигнала, параллельный оси частот (как правило, ось ординат), или область определения сигнала по этой оси.

Популярный набор

Синонимы: Частый предметный набор

Термин относится к ассоциативным правилам и задаче анализа рыночной корзины.

Популярный предметный набор - это предметный набор с поддержкой, которая больше или равна заданному порогу, называемому минимальной поддержкой. На основе популярных наборов работает алгоритм поиска ассоциативных правил a priori.

Внешний контур управления

В бизнесе система управления взаимодействиями с контрагентами, клиентами и покупателями продукции (работ услуг) предприятия. В плане представляет собой комплекс программно-аппаратных средств, позволяющих предприятию обмениваться данными и документами через телекоммуникационные каналы, в частности Интернет, с покупателями и клиентами. Является важнейшей частью системы ERP.

Оперативный обмен данными с внешней средой позволяет эффективно консолидировать их с целью последующего анализа с помощью технологий Data Mining.

Полное дерево решений

Дерево решений, в котором все листья являются «чистыми», т.е. содержат объекты только одного класса. Можно ожидать, что полное дерево решений будет очень хорошим классификатором, поскольку ему удалось распознать все обучающие примеры. Однако на практике таковыми не пользуются, а упрощают их, пусть даже за счет некоторой потери точности. Это связано со следующими причинами:

  • Полные деревья решений подвержены переобучению.
  • Они имеют очень сложную структуру, как правило, содержат большое количество ветвей, узлов и листьев, что затрудняет их понимание и интерпретацию пользователем.
  • Значимость правил в конечных узлах часто оказывается очень низкой, поскольку они относятся к малому числу примеров.

На практике полные деревья решений либо упрощают путем отсечения ветвей, либо ограничивают рост дерева, не давая ему достичь полноты. В качестве критерия оптимальности при этом используют или ошибку, или минимальное допустимое число примеров в узле.

Нейронная сеть полносвязная

Нейронная сеть, в которой каждый нейрон передает свой выходной сигнал на вход остальных нейронов, а также самому себе. Архитектура полносвязной нейронной сети представлена на рисунке.

Полносвязные нейронные сети могут быть со скрытыми нейронами и без них. В первом случае входной сигнал подается не на все нейроны и/или выходной сигнал снимается не со всех нейронов. Во втором случае входной сигнал подается на все нейроны и/или снимается со всех нейронов. Одним из видов полносвязных нейронных сетей является сеть Хопфилда.

Функционал

Переменная величина, заданная на множестве функций, т. е. зависящая от одной или нескольких функций. Есть и другое определение: функция, аргументы которой также представляют собой функции некоторых переменных. Наконец, по третьему и весьма распространенному определению – то же, что и функция.

Типичными примерами функционалов являются норма функции, ее значение в фиксированной точке, ее максимум или минимум на отрезке, величина интеграла от функции и т.д.

Функционально-ориентированное хранилище данных

Хранилище данных, оптимизированное с точки зрения решения конкретных аналитических задач некоторого подразделения компании, направления деятельности, решаемых задач или группы аналитиков. Функционально-ориентированное хранилище отражает в своей модели принципы анализа, а не бизнес-логику предметной области.

Цель создания таких хранилищ – получить систему максимальной готовности, не требующую дополнительных затрат на внедрение, минимизирующую длительность ETL и обеспечивающую более высокую производительность при решении конкретных задач.

Однако функционально-ориентированное хранилище имеет заметно меньше возможностей для расширения вместе с развитием бизнеса как при увеличении объемов данных, так и при пополнении ассортимента продуктов и услуг компании.

Нечеткая логика

Раздел математики, представляющий собой обобщение классической логики и теории множеств. Понятие нечёткой логики было введено профессором Лютфи Заде в 1965 г., который в своих работах расширил понятие "множеств" допущением, что функция принадлежности элемента к множеству может принимать любые значения в интервале [0..1], а не только 0 или 1. Такие множества стали называть нечеткими. Предметом нечеткой логики является построение моделей приближенных рассуждений человека и использование их в анализе данных, системах управления и поддержки принятия решений в компьютерных системах. В основе нечеткой логики лежит описание объектов и процессов с помощью нечетких множеств.

Нечеткая логика широко используется в задачах управления и моделирования сложных систем, экспертных системах, аналетических технологиях и многих других приложениях. Основными потребителями систем, использующих нечеткую логику, являются банкиры и финансисты, а также специалисты в области политического и экономического анализа. Элементы нечеткой логики можно найти в десятках промышленных изделий: от систем управления электропоездами и боевыми вертолетами до пылесосов и стиральных машин. Без ее применения немыслимы современные ситуационные центры руководителей западных стран, где принимаются ключевые политические решения и моделируются разные кризисные ситуации.

Нечеткое правило

Условное высказывание вида 'если X есть A, то Y есть B', где A и B – нечеткие множества. На математическом языке правило есть связь между нечеткими множествами. Каждое правило определяет 'нечеткое' пятно (произведение AхB) в 'пространстве состояний' системы. Чем обширнее нечеткие множества A и B, тем обширнее и более неопределенное нечеткое 'пятно'.

Нечеткие правила нечетких систем являются блоками для построения знаний. Можно сказать, что каждое из них действует как ассоциативная память, связывающая нечеткий отклик B с нечетким стимулом A.

Нечеткое множество

Синонимы: Размытое множество

Пусть S - некоторое множество, x - элемент S, а P - некоторое свойство. Обычное (четкое) подмножество A множества S, элементы которого удовлетворяют свойству P определяется как множество упорядоченных пар A ={mA(х)/х}, где mA(х) - характеристическая функция, принимающая значение 1, если х удовлетворяет свойству P, и 0 - в противном случае.

Нечеткое подмножество отличается от обычного тем, что для элементов х из S нет однозначного ответа "да-нет" относительно свойства P. В связи с этим, нечеткое подмножество множества S определяется как множество упорядоченных пар A ={mA(х)/х}, где mA(х) - характеристическая функция (или просто функция принадлежности), принимающая значения из некоторого упорядоченного множества M=[0,1]. Функция принадлежности указывает степень (уровень) принадлежности элемента x подмножеству A . Множество M называют множеством принадлежностей. Если M={0,1}, то нечеткое подмножество A может рассматриваться как обычное или четкое множество.

Иными словами, если для обычного множества на вопрос принадлежит ли ему некоторый элемент, можно ответить только «да» или «нет», то для нечеткого множества – принадлежит, но в большей или меньшей степени.

Рассмотрим множество S={x1, x2, x3, x4, x5}, на котором задано нечеткое подмножество F с заданными значениями функции принадлежности: mA(x1)=0,2; mA(x2)=0,5; mA(x3)=0,7; mA(x4)=0; mA(x5)=1.

Можно сказать, что элемент x5 полностью принадлежит нечеткому множеству F, элемент x2 только наполовину, а элемент x4 совсем ему не принадлежит. Тогда само нечеткое множество F может быть записано в виде:

F={0,2/x1; 0,5/x2; 0,7 /x3; 0/x4, 1/x5}

или

F=0,2/x1+0,5/x2+ 0,7 /x3+0/x4+ 1/x5,

где «+» означает операцию объединения. Существуют и другие способы записи нечетких множеств, например, табличные.

Рассмотрим простой пример. Пусть задано множество S={Жигули, Рено, Мерседес,…} марок автомобилей и множество S’, определяющее цену автомобиля. Тогда на множестве S’ мы можем определить нечеткие подмножества, определяющие доход владельца автомобиля типа «Высокий», «Средний», «Низкий».

Как видно из рисунка, четкая граница между множествами отсутствует. Действительно, утверждать, что если человек купил машину дороже, чем за 10 000$ то он точно имеет средний достаток, а если меньше - то низкий, нельзя. На рисунке видно, что с увеличением цены функция принадлежности для множества «Низкий» уменьшается от 1 к 0. Т.е. после некоторого значения цены уровень принадлежности к множеству «Низкий» падает до 0. В то же время после некоторого значения цены начинает возрастать уровень принадлежности к множеству «Средний» и т.д. Таким образом, можно совершить переход от строго формализованного показателя "Цена" к неформальному понятию «Уровень дохода», свойственному больше для человеческих рассуждений типа «Если у него Мерседес, то он имеет высокий доход».

На описании объектов и процессов с помощью нечетких множеств основан раздел математики, получивший название нечеткая логика. Элементы нечеткой логики в последние несколько десятилетий широко применяются при моделировании сложных систем, системах управления и анализа. В частности, в технологиях Data Mining нечеткая логика используется для решения задач прогнозирования и кластеризации, построения нечетких ассоциативных правил, нейронечетких сетей и др.

Нечеткая система

Множество нечетких правил, преобразующих входные данные в выходные. В простейшем случае эксперт устанавливает эти правила, а в более сложном нейросетевая система обучается правилам по данным или по наблюдениям за действиями людей-экспертов.

На каждый пример входных данных в некоторой степени откликаются все правила в массивной ассоциативной памяти. Чем ближе сходство входного примера с частью 'если' нечеткого правила, тем больше отклик части 'то'. В нечеткой системе все эти отклики или множества 'то' складываются, и берется их среднее или центроидное значение. Этот центроид является выходным результатом данной системы. Теорема о нечеткой аппроксимации утверждает, что нечеткая система может моделировать любую непрерывную систему. Каждое ее правило действует как нечеткое "пятно", которое система ставит таким образом, чтобы имитировать отклик непрерывной системы на все возможные стимулы.

Просмотров: 527 | Добавил: capeas | Рейтинг: 0.0/0
Всего комментариев: 0