Хранилище файлов Воскресенье, 19.05.2024, 06:41
Меню сайта
Главная » 2014 » Июль » 23 » Скачать Тематическое разграничение доступа в информационно-поисковой системе на основе авторубрикации. Баранов, Юрий Александрович бесплатно
00:28
Скачать Тематическое разграничение доступа в информационно-поисковой системе на основе авторубрикации. Баранов, Юрий Александрович бесплатно

Тематическое разграничение доступа в информационно-поисковой системе на основе авторубрикации

Диссертация

Автор: Баранов, Юрий Александрович

Название: Тематическое разграничение доступа в информационно-поисковой системе на основе авторубрикации

Справка: Баранов, Юрий Александрович. Тематическое разграничение доступа в информационно-поисковой системе на основе авторубрикации : диссертация кандидата технических наук : 05.13.19 / Баранов Юрий Александрович; [Место защиты: С.-Петерб. политехн. ун-т] - Санкт-Петербург, 2009 - Количество страниц: 140 с. ил. Санкт-Петербург, 2009 140 c. :

Объем: 140 стр.

Информация: Санкт-Петербург, 2009


Содержание:

ВВЕДЕНИЕ
ГЛАВА 1 ПРОБЛЕМА РЕАЛИЗАЦИИ ТЕМАТИЧЕСКОГО РАЗГРАНИЧЕНИЯ ДОСТУПА В ИПС
11 отличие тематического разграничения доступа от других методов, регулирующих доступ существующие подходы к тематическому разграничению доступа
12 анализ существующих подходов к авторубрикации текстов
13 авторубрикация на основе статистических критериев
14 моделирование связи тематики и статистических характеристик текстов
15 выводы
ГЛАВА 2 ТЕОРЕТИЧЕСКОЕ ОБОСНОВАНИЕ ПОДХОДА К АВТОРУБРИКАЦИИ, ИСПОЛЬЗУЕМОГО В ТЕМАТИЧЕСКОМ РАЗГРАНИЧЕНИИ ДОСТУПА
21 моделирование s-цепочек символов в тексте последовательностью независимых случайных величин
211 использование статистики степени рассеивания для построения критерия независимости
212 теоретическое обоснование критерия независимости появления s-цепочек в текстеб
213 экспериментальные исследования независимости s-цепочек в тексте
22 мера тематической близости текстов, моделируемых параметрами полиномиальных схем
221 теоретическое обоснование области применения меры близости для различных входных данных
23 выводы
ГЛАВА 3 РАЗГРАНИЧЕНИЕ ДОСТУПА В ИПС НА ОСНОВЕ АВТОРУБРИКАЦИИ
31 использование статистической меры близости текстов в подходе к тематическому разграничению доступа
311 статистический критерий принадлежности текста к заданной области знаний
312 методика тематического разграничения доступа в ипс
32 теоретические оценки достоверности разграничения доступа
33 выводы
ГЛАВА 4 РАЗРАБОТКА И РЕАЛИЗАЦИЯ СИСТЕМЫ ТЕМАТИЧЕСКОГО РАЗГРАНИЧЕНИЯ ДОСТУПА
41 экспериментальная оценка работы подхода к тематическому разграничению доступа на основе авторубрикации
411 измерение оценок достоверности подхода к авторубрикации текстов относительно внутренних параметров
412 измерение оценок работы подхода к тематическому разграничению доступа относительно входных данных
413 сравнение описываемого подхода к авторубрикации с существующими аналогами
42 функционирование тематического разграничения доступа в ипс
421 архитектура системы тематического разграничения доступа в ипс
43 применение разработанного подхода к авторубрикации для других задач
44 выводы

Введение:

Существующие методы и средства управления доступом с использованием различных моделей политик безопасности весьма разнообразны, но все они основаны на присвоении объектам контроля доступа некоторых меток безопасности или атрибутов. Назначение данных меток и атрибутов представляет собой отдельную задачу, которая в настоящее время решается без технических средств, а исключительно организационными мерами. Вместе с тем в значительном количестве случаев пользователь заинтересован в управлении доступом исходя из содержания текстовой информации, представленной в документах [60], базах данных[46] и т.д.
Подобная модель политики безопасности называется тематической политикой доступа и имеет ограниченное распространение, прежде всего потому, что её реализация требует трудоёмкой предварительной работы по разбиению исходной информации по рубрикам, которая, как правило, осуществляется экспертами с применением различных средств, не обеспечивающих эффективную автоматизацию разделения текстов на тематические классы.
Данная работа продолжает исследования как отечественных ученых: Гайдамакин Н.А, Поспелов Б.А., Девянин П.Н., Арапов М. В., Пиотровский Р. Г., так и зарубежных: Н. Кресси, Р. Рида, Д. Мак-Лин, Р. Сандху, Д. Клиффорд, Дж. Кэрри и других. Работа опирается на результаты этих исследований и развивает их отдельные положения применительно к задаче тематического управления доступом с автоматическим разделением информации по заданным темам.
Применение политики тематического разграничения доступа целесообразно для контроля доступной пользователю информации на предмет отнесения ее к сведениям, доступ к которым нежелателен[18] той или иной категории пользователей, а также при создании объединённых систем баз данных, используемых пользователями с различными полномочиями относительно семантического содержания. Особенно это актуально в отношении систем контроля доступа в сети Интернет, что востребовано, например, в образовательных учреждениях. Отличительной особенностью тематического управления доступом является необходимость категорирования информации, что затрудняет реализацию подобных систем и требует разработки новых подходов. Однако, при условии автоматизации эффективного разбиения информации на классы, системы реализующие политику тематического разграничения доступа, могут работать с неограниченным множеством объектов доступа (текстов).
Актуальность разработки подхода к автоматическому разбиению информации на тематические классы также подчеркивается возможностью его использования в аналитических и информационных системах.
Представленная работа посвящена исследованию создания систем управления доступом, основанных на применении решения о доступе к информационному объекту на основе автоматизации разбиения текстовых данных по тематическому признаку (автоматической рубрикации текстов).
Необходимо также отметить отдельно, что разрабатываемый подход к управлению доступом инвариантен относительно естественных языков, на которых написаны документы. Положительным отличием предлагаемого подхода от большинства других алгоритмов автоматического определения тематики текстов состоит в том, что для текстов на различных языках при обучении системы требуется только умение определить тематику текста, тогда как во многих других системах необходимо более глубокое знание естественных языков.
Целью диссертационной работы является разработка подхода к созданию систем тематического управления доступом в справочных и информационно-поисковых системах на основе автоматического отнесения текстов к заданным тематическим рубрикам с использованием статистических критериев.
Для достижения этой цели необходимо решить следующие задачи:
1. Предложить и обосновать подход к реализации систем тематического управления доступом, основанный на автоматической рубрикации текстов.
2. Разработать модель текста, позволяющую определить его принадлежность к тематическим рубрикам в автоматизированном режиме.
3. Разработать и обосновать критерий принадлежности текста к заданной тематической рубрике для использования его в тематическом разграничении доступа и исследовать оценку его достоверности при различных параметрах функционирования.
4. Предложить методику тематического управления доступом на основе автоматической рубрикации текстов.
5. Разработать архитектуру системы тематического управления доступом на основе предложенного подхода.
Решение сформулированных задач проводилось с помощью аппарата теории вероятностей и математической статистики, теории математической лингвистики, теории систем и основ теории защиты информации. Для решения сформулированных задач применялся анализ подходов к реализации систем, осуществляющих тематическое управление доступом, изучение современных алгоритмов разделения текстов.
Научная новизна диссертационной работы состоит в следующем:
1. Сформулирован подход к построению систем тематического управления доступом на основе автоматического разделения текстов по тематическим рубрикам с использованием статистических критериев.
2. Предложена и обоснована оригинальная модель текстовых данных, позволяющая разработать критерий отнесения текста к тематическим рубрикам.
3. Впервые предложен и математически обоснован критерий автоматического отнесения текста к заданным тематическим рубрикам на основе анализа распределения цепочек символов.
4. Разработана методика управления доступом по тематическому признаку, содержащая рекомендации по выбору параметров входных данных (объёмов текстов, количества рубрик, естественных языков), а также параметров подхода к авторубрикации.
5. Разработана архитектура системы тематического управления доступом на основе предложенного подхода.
Практическая ценность работы состоит в том, что её результаты позволяют:
1. Контролировать доступ к информации,' полученной из открытых и общедоступных источников (например, Интернет), исходя из ее тематического направления, для различных категорий пользователей в зависимости от различных факторов (например, возрастные ограничения).
2. Реализовать систему тематического разграничения доступа в архивных и библиотечных системах, с автоматическим разбиением добавляемой в них информации по тематическим рубрикам.
Практическая ценность и новизна работы подтверждаются актами об использовании: от Учреждения Российской академии наук ИЛИ РАН (результаты применены при реализации подсистемы назначения полномочий сотрудников ведомственной компьютерной сети) и от ЗАО «МВП Свемел» (разработанная методика применена при создании системы документооборота).
Основные теоретические и практические результаты работы обсуждались на XVII и XVIII общероссийских научно-технических конференциях «Методы и технические средства обеспечения безопасности информации» (2008, 2009 Санкт-Петербург).
По теме диссертации опубликовано 9 работ, в их числе 6 научных статей, из них в изданиях, входящих в перечень утвержденных ВАК РФ - 6, и 3 доклада на конференциях.
Основные положения, выносимые на защиту: • Подход к тематическому разграничению доступа с использованием автоматического разделения информации по тематическим рубрикам.
• Модель текстовых данных, основанная на характеристиках распределения частот появления цепочек символов постоянной длины.
• Статистический критерий принадлежности текстовых данных к тематическим рубрикам в системах управления доступом на основе анализа распределения цепочек символов.
• Методика тематического разграничения доступа, основанная на статистическом подходе к авторубрикации текстов.
• Архитектура системы тематического управления доступом в информационно-поисковых системах, при обработке информации из общедоступного источника.
Диссертация состоит из введения, четырех глав, заключения и списка литературы из 63 наименований.

Скачивание файла!Для скачивания файла вам нужно ввести
E-Mail: 6616
Пароль: 6616
Скачать файл.
Просмотров: 106 | Добавил: Денис41 | Рейтинг: 0.0/0
Форма входа
Поиск
Календарь
«  Июль 2014  »
ПнВтСрЧтПтСбВс
 123456
78910111213
14151617181920
21222324252627
28293031
Архив записей
Друзья сайта
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz
  • Copyright MyCorp © 2024
    Конструктор сайтов - uCoz