Сборник статей международной студенческой конференции. Барнаул: Корвус, 2015. 53 с. Настоящий



Pdf просмотр
страница3/4
Дата17.11.2016
Размер8.94 Mb.
Просмотров962
Скачиваний1
ТипСборник
1   2   3   4

Литература
1.
Информация о системе АИСТ. [Электронный ресурс]. Режим доступа: http://aist.magtu.ru
— Загл. с экрана.
2.
Введение в АИСТ. [Электронный ресурс]. Режим доступа: http://aist.elsu.ru
— Загл. с экрана.



3.
Шайдуров А.А., Зацепин П.М. Информационно-поисковые системы для intranet-сетей // Известия Алтайского государственного университета. 2000. № 1. С. 061-062.
4.
Цхай А.А., Рыков Д.А., Сибиряков А.В., Шайдуров А.А.
Информационная система мониторинга деятельности сельхозпроизводителей для повышения эффективности регионального управления // Вычислительные технологии. 2011. Т. 16. № 6. С. 85-92.



СВОБОДНОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕКАК ПРОСТРАНСТВО
ДЛЯ ВОПЛОЩЕНИЯ ЛЮБОЙ ИДЕИ
Р.В. Краев

Свободное и бесплатное программное обеспечение (ПО) — это разные вещи, так как свободное ПО можно модифицировать, изменять на коренном уровне и добавлять новые модули. Бесплатное ПО – это лицензионная программа с закрытым кодом, что запрещает еѐ модифицировать и производить любые иные действия которые не разрешены лицензией.
Обычный пользователь может не видит разницы между коммерческим и свободным ПО, кроме красивой обложки. Однако на более высоком уровне, где компании тратят большой бюджет для покупки лицензий, в то время как можно нанять специалистов для настройки свободного ПО и забыть про лицензии, это очень серьезная вещь по отношении к бюджету и пользователю.
Как показывает статистика, примерно 90% [1]пользователей имеют на своем домашнем ПК операционную систему Windows. И это не случайность, так как Windows зарекомендовала себя как самая удобная операционная система
(ОС). Пользоваться данной ОС для всех кажется простой нормой. Например, можно полностью заменить настройки рабочего стола. Так же в Windows присутствует большое количество служб, которые зачастую не используются, и могут принести потенциальную угрозу фирме. Службы которые не используются также нагружают систему. Их можно отключить, но удалить нельзя. Такие бесполезные службы могут представлять серьезную уязвимость в системе, так как об них забывают пользователи, но помнят злоумышленники.
Однако, если установить Linux, как основную операционную систему – то в результате еѐ настраивания можно добавлять функционал или урезать его.
Существует Linux и для обучения, где высокая степень защиты ОС в виде запуска приложений в отдельных виртуальных машинах.[2] Linux представлен в виде ОС для тестирования и проверки безопасности приложений и сетей,[3] в виде максимально уязвимой системы,[4] и т.д. Все эти Linux-системы очень хорошо подходят для обучения специалистов. При этом, указанные виды Linux представляют только малую часть Linux-систем. Linux как свободная ОС очень далеко продвинулась по возможностям модифицирования и настройки, до той степени которая нужна конечному пользователю.
Свободное ПО используется большим количеством пользователей: от обычного офисного работника, который работает с мультимедийными файлами до достаточно серьѐзного специалиста всех сфер. Можно создать на основе любой свободной программы свою версию модификации с добавлением нужного функционала или его удаления за ненадобностью.
Свободное ПО позволяет не только возможность модифицировать и предлагать свои версии программ. Зная принцип работы ядра программы, продвинутое сообщество программистов, может помочь в поисках уязвимости и улучшении функционала продукта, для обеспечения нужд рядовых пользователей. Таким образом, коллективное создание свободного ПО – простая



возможность реализовать любую безумную идею. Некоторые программы созданные в сообществе и являющиеся свободными, имеют достаточно серьезную поддержку сообщества, которое указывает на недостатки и помогает данные программы сделать лучше [5,6].
Коммерческое ПО никогда не сможет достичь тех целей которое может свободное ПО. Хотя коммерческое ПО и легко поставить и настроить, но оно ограничено и не позволит вам выйти за рамки, которые были поставлены производителем.
Что касается аппаратной части, зачастую свободное ПО требует меньше ресурсов. Если в свободном ПО есть ненужная функция, то вы можете еѐ убрать.
То есть не просто в настройках отключить, а удалить из функционала ПО или
ОС, тем самым уменьшив размер самой программы и возможно увеличив быстродействие, из-за отсутствия этой функции для которой требовались дополнительные ресурсы.
К примеру, можно взять тот же Windows которые не способен без значительных ресурсов запустится на микроконтроллере или же портативном
ПК, например Rasbery Pi [7]. Конечно, сейчас аппаратная часть этого карманного
ПК ушла далеко и может поддерживать Windows, но изначально на ней мог стоять только Linux, так как его можно было модифицировать и оставлять только необходимый для платформы функционал.
Литература
1.
Статистическая доля рынка интернет технологий. [Электронный ресурс] —
Заглавие с экрана. Режим доступа: http://www.netmarketshare.com
2.
Официальный сайт TAILS. [Электронный ресурс] — Заглавие с экрана.
Режим доступа: https://tails.boum.org/index.en.html
3.
Официальный сайт KAIL. [Электронный ресурс] — Заглавие с экрана.
Режим доступа: https://www.kali.org
4.
Самая уязвимая система Damn Vulnerable Linux. [Электронный ресурс] —
Заглавие с экрана. Режим доступа: http://www.damnvulnerablelinux.org.
5.
Цхай А.А., Рыков Д.А., Сибиряков А.В., Шайдуров А.А. Информационная система мониторинга деятельности сельхозпроизводителей для повышения эффективности регионального управления // Вычислительные технологии.
2011. Т. 16. № 6. С. 85-92.
6.
Цхай А.А., Рыков Д.А., Сибиряков А.В., Шайдуров А.А. Информационно- моделирующая система мониторинга деятельности сельхозпроизводителей региона // Известия Алтайского государственного университета. 2011. № 1-
2. С. 126-130.
7.
Что такое Raspberry Pi. [Электронный ресурс] — Заглавие с экрана. Режим доступа: https://www.raspberrypi.org/help/what-is-a-raspberry-pi.



ПРИМЕНЕНИЕ СВОБОДНОГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
ДЛЯ МНОГОМЕРНОГО АНАЛИЗА ДАННЫХ
О.В. Махныткина, С.К. Хакимов, С.Ш. Чилаев
В настоящее время многомерный анализ данных активно применяется практически во всех областях исследований [1, 2, 3, 4]. Многомерный анализ данных представляет собой совокупность методов и алгоритмов, которые позволяют получать информацию о массиве данных, расположенных в некоторой области многомерного пространства.
Реализация алгоритмов многомерного анализа данных наряду с коммерческими статистическими пакетами, также представлена в свободном программном обеспечении для статистического анализа данных. При этом необходимо отметить, что некоторые свободно распространяемые статистические пакеты не только не уступает, но и превосходит по функциональности коммерческие. Рассмотрим некоторые примеры свободного
ПО для многомерного анализа данных.
PSPP является свободным программным обеспечением для статистического анализа данных. PSPP позволяет проводить расчет основных показателей описательной статистики и применять основные методы многомерного анализа данных. Так, в PSPP представлен корреляционный анализ
(позволяет оценить степень тесноты связи между переменными); регрессионный анализ (определяет аналитическую зависимость между показателями и факторами); кластерный анализ (служит для нахождения групп сходных объектов); факторный анализ (предназначен для выделения из множества всех факторов те, которые действительно оказывают влияние на изменение зависимой переменной).
С использованием PSPP проводятся научные исследования в различных областях. Например, в работе [5] с использованием PSPP был выполнен статистический анализ динамики морфометрических параметров макулярной зоны по данным оптической когерентной томографии у пациентов с возрастной макулярной дегенерацией после факоэмульсификации катаракты с имплантацией интраокулярной линзы. В [6] анализируется эффективность восстановления целостности грудины с использованием имплантата из никелида титана при послеоперационных стерномедиастинитах. В работе [7] показаны возможности факторного анализа, который в совокупности с теоретическим исследованием позволяет определить эффективность национальной пенитенциарной системы.
Примером пакетов с открытым кодом является пакет R, объединяющий в себе одноименный язык и среду статистической обработки данных. В настоящее время R предоставляет большое количество методов, в том числе линейное и нелинейное программирование, классификацию и кластеризацию, факторный и компонентный анализ и пр. Преимущество R состоит в возможности расширений за счѐт дополнений, при этом создание новых дополнений не требует знания никаких языков программирования кроме самого



R. Считается, что R является лидером среди свободно распространяемых систем статистического анализа и используется широким кругом специалистов.
Например, работе [8] на основе компонентного анализа с использованием R был построен сводный показатель финансовых рисков для оценки способности финансовой системы качественно и бесперебойно выполнять свои функции. В
[9] рассматривается использование дисперсионного анализа, регрессионного анализа, многомерных методов классификации на примерах биологического характера.
Среди других примеров свободного ПО для многомерного анализа данных можно выделить Gretl, SIMFIT, Weka, KNIME и проч. Таким образом, в настоящее время свободное ПО предоставляет широкие возможности для проведения многомерного анализа данных.
Литература
1.
Нименья И.Н. Многомерный статистический анализ развития кризиса в реальном секторе экономики//Вестник ИНЖЭКОНа. Серия: Экономика.
2012. № 2. С. 151-159.
2.
Каширский Д.В. Gроблемы применения количественных методов в современной российской психологии//Вестник алтайской науки. 2013. № 2-
1. С. 170-174.
3.
Беляев И.А., Кучерявский С.В., Родионова О.Е., Померанцев А.Л.
Многомерный анализ изображений в медицине и биологии//Энциклопедия инженера-химика. 2011. № 2. С. 13-23.
4.
Мальцева А.В. Современные информационные технологии в обеспечении прикладных исследовательских задач в социально-культурной сфере//Известия Алтайского государственного университета. 2009. № 1. С.
143.
5.
Кузнецов А.А., Тур Е.В., Кузнецова Н.В., Быстров А.М. динамика морфометрических параметров макулярной зоны по данным оптической когерентной томографии у пациентов с возрастной макулярной дегенерацией после факоэмульсификации катаракты с имплантацией интраокулярной линзы//Вестник
Оренбургского государственного университета. 2014. № 12. С. 190-194.
6.
Шведова М.В., Вусик А.Н., Дамбаев Г.Ц., Козлов А.Е., Порохова Е.Д.
Восстановление целостности грудины у пациентов с послеоперационным стерномедиастинитом//Сибирский медицинский журнал (г. Томск). 2014. Т.
29. № 4. С. 45-51.
7.
Тепляшин П.В. Оценка эффективности пенитенциарной системы: метод факторного анализа//Юридическая наука и правоохранительная практика.
2015. № 2 (32). С. 80-90.
8.
Гамбаров Г.М. Мхитарян В.С. Моделирование обобщенного показателя рисков финансовой системы страны//Математико-статистический анализ социально-экономических процессов: Межвузовский сборник научных



трудов. Выпуск 10/ Московский государственный университет экономики, статистики и информатики.- М., 2013.-C 21-26 9.
Шитиков В.К., Розенберг Г.С. Рандомизация и бутстреп: статистический анализ в биологии и экологии с использованием R. - Тольятти: Кассандра,
2013. - 314 с.



РАЗРАБОТКА СИСТЕМЫ ОБНАРУЖЕНИЯ ПЛАГИАТА НА ОСНОВЕ
НЕРЕЛЯЦИОННОЙ БАЗЫ ДАННЫХ MONGODB И СИСТЕМЫ ДЛЯ
РАСПРЕДЕЛЕННОГО ВЫЧИСЛЕНИЯ APACHE HADOOP
С.В. Мурзинцев, А.А. Цхай
В связи с бурным развитием информационных технологий и повсеместным их внедрением во все сферы человеческой деятельности появляется большое количество информации, которая аккумулируется на различных сайтах в сети Интернет. Это ведет к достаточно интенсивному обмену идеями, мысиплагиата в различных сферах: образования, науки, промышленности. Проблема, связанная с заимствованием идей и результатов научной деятельности, активно обсуждается в образовании и научном сообществе. Для поиска механизма защиты в различных учреждениях создаются отделы, которые занимаются проверкой научных работ на наличие заимствований как «ручным» способом, так и с использованием специализированных программ. Выявление плагиата в документах достаточно сложная проблема, так как плагиат может варьироваться от прямого копирования текстов до плагиата идей. В данной статье мы бы хотели акцентировать внимание на бесплатном и свободном программном обеспечении, которое может использоваться для разработки систем занимающихся выявлением заимствованием.
На рынке представлены различные сервисы по обнаружению плагиата, например: интернет-сервис «Антиплагиат», «eTXTАнтиплагиат», SafeAssign,
CopyScape. Все перечисленные системы имеют закрытый исходный код и отсутствие какого-либо упоминания о технологиях, которые используются при анализе документов.
Для разработки нашей системы мы используем следующее программное обеспечение:
1.
MongoDB 2.4.9 - документо-ориентированная система управления базами данных с открытым исходным кодом, не требующая описания схемы таблиц.
2.
Hadoop Apache - проект фонда Apache Software Foundation, свободно распространяемый набор утилит, библиотек и фреймворков для разработки и выполнения распределѐнных программ, работающих на кластерах из сотен и тысяч узлов. Используется для реализации поисковых и контекстных механизмов многих высоконагруженных веб-сайтов.
3.
Linux Ubuntu server 12.04 LTS - операционная система, основанная на Debian GNU/Linux.
4.
Eclipse – это программная платформа с открытым исходным кодом, написанная на языке Java. Основная цель ее создания - повышение производительности процесса разработки программного обеспечения.
5.
Robomongo 0.8.5 - это оболочка, кросс-платформенный инструмент с открытым исходным кодом для управления MongoDB.
6.
VirtualBox - программный продукт виртуализации для



операционных систем Microsoft Windows, Linux, FreeBSD, Mac OS X,
Solaris/OpenSolaris, ReactOS, DOS и других.
На основе описанного программного обеспечения нами была разработана система обнаружения плагиата, общая структура которой представлена ниже. Работа системы разделена на две части: клиентскую и серверную. Клиентская часть включает в себя формирование «отпечатков» документа, используя алгоритм Winnowing [1] и отправку сформированных
«отпечатков» на сервер для проверки. Алгоритм работы пользователя, для проверки документа на наличие заимствований предполагает, что:
1.
Пользователь скачивает программу с сайта компании, предоставляющие соответствующие услуги.
2. Пользователь с помощью скачанной программы формирует
«отпечатки» проверяемого документа используя алгоритм Winnowing.
3. Пользователь отправляет «отпечатки» своего документа на сервер предприятия, указав параметры при которых он осуществлял формирование
«отпечатков».
4. Пользователь получает отчет о проверяемом документе.
Серверная часть занимается получением, обработкой, сравнением
«отпечатков» документов с базой «отпечатков» организации и формированием отчѐтов для отправки пользователям.
Из представленной архитектуры становится очевидно, что содержимое документа пользователя для организации занимающейся проверкой документов на заимствования, является полностью закрытым. Организация работает только с «отпечатками» (хешами), которые предоставил пользователь. Восстановить документ пользователя по предоставленным «отпечаткам» не представляется возможным, так как, во первых, алгоритм Winnowing отбрасывает часть хешей, тем самым ужимая содержимое документа, а, во вторых, содержимое данных для проверки представлено в виде хешей («отпечатков»). Таким образом становится ясно, что исходный документ пользователя гарантированно не подлежит восстановлению.
Очевидно, что предъявленная архитектура существенно увеличивает требования к мощности вычислительных ресурсов, которые необходимы для сравнения «отпечатков», поступающих для анализа на плагиат. Так же данная система требует больших объемов дискового пространства для хранения
«отпечатков» всех документов с которыми сравниваются присылаемые
«отпечатки».
Несмотря на все описанные недостатки, данный подход к защите содержимого документа пользователя становится всѐ более реализуем [2].
Проблема, связанная с хранением большого количества данных, может быть решена за счѐт использования нереляционной базы данных MongoDB и технологии распределенного хранения данных (Sharding в MongoDB). А технология MapReduce может способствовать решению проблемы, связанной с поиском среди большого количества документов [3].
Нами был разработан прототип информационной системы для проверки



документов на заимствования, в котором используются описанные технологии.
Структура информационной системы представлена на рисунке 1.
Рисунок 1. Прототип информационной системы для защищенной проверки документов пользователей на заимствования
Разработанная система способствовала лучшему пониманию механизмов, связанных с работой поиска в нереляционной базе MongoDB при использовании Sharding и технологии MapReduce. В настоящее время осуществляется совершенствование возможностей информационной системы через написание новых модулей, а также специальных алгоритмов для работы с другими технологиями, например, такими как Apache Hadoop [4].
В заключении стоит отметить что благодаря используемому бесплатному и свободному программному обеспечению был разработан прототип программного комплекса и проведены соответствующие эксперименты, которые способствовали выработки новых стратегий по улучшению описанного механизма проверки документов на наличие плагиата.
Так же в перспективе планируется интеграция нереляционной базы данных
MongoDB и системы распределенного вычисления Hadoop Apache. MongoDB будет выступать в роли системы для хранения данных, а Apache Hadoop в роли средства, использующего технологию MapReduce для распределенного поиска.
Литература



1. Schleimer S., Wilkerson D., Aiken A. Winnowing: Local Algorithms for
Document Fingerprinting // ACM SIGMOD International Conference on Management of Data, June 2003. Proceedings. P. 76-85.
2. Цхай А.А., Бутаков С.В., Мурзинцев С.В., Ким Л.С. Обнаружение плагиата с использованием нереляционных баз данных // Вестник алтайской науки 2015. Выпуск: 1. С. 280-285.
3. Документация по работе с базой данных MongoDB. [Электронный ресурс]URL: http://docs.mongodb.org/manual/reference/command/mapReduce/ (дата обращения: 12.09.2015)
4. Apache Hadoop. [Электронный ресурс] http://hadoop.apache.org (дата обращения: 12.09.2015)



РАЗРАБОТКА СВОБОДНОГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
СКРИНИНГА ЗАБОЛЕВАНИЙ
К. П. Стародубцев

Одной из наиболее важных проблем в современной медицине является ранняя диагностика заболеваний. Диагностика больных затруднена постоянным изменением данных, в силу которого приходится обрабатывать большие массивы информации. Поэтому, одним из путей повышения эффективности диагностики, является разработка проблемно-ориентированных систем обработки информации и применение к ним математических методов анализа информации.
Использование методов искусственного интеллекта и статистических методов составляет практическую основу для построения системы поддержки принятия диагностических решений [1]. Рекомендации системы могут использоваться как врачами для принятия решений о состоянии здоровья пациента, так и самими пациентами для определения предрасположенности к тому или иному заболеванию. Цель проекта заключается в исследовании взаимосвязей между исходными данными и разработке проблемно- ориентированной системы обработки информации и принятия диагностических решений.
Для создания полноценной интеллектуальной диагностической системы необходимо осуществление трех основных этапов: сбор данных, математический анализ данных, разработка программного обеспечения.
Сбор данных о пациентах подразумевает формирование информации о пациентах, которым поставлен исследуемый диагноз и о пациентах, которым не поставлен исследуемый диагноз. При этом анализируемые данные должны иметь достаточное количество записей, чтобы была возможность их обработки математическими методами.
Математический анализ данных подразумевает предварительную обработку данных, а также исследование данных при помощи методов статистического анализа (факторный, кластерный, дискриминантный). Кроме методов статистического анализа возможно включить использование методов искусственного интеллекта, в частности искусственных нейронных сетей.
Нейросетевые методы позволяют более точно осуществлять диагностику пациентов в условиях большой лабильности клинических проявлений. Соответственно необходимо проведение исследований в целях создания системы обработки информации и интеллектуальной поддержки принятия решений на основе применения методов системного анализа. Это позволит на ранних стадиях развития заболеваний своевременно и точно оценивать вид поражения и проводить лечебные мероприятия [2].
Разрабатываемая система в первую очередь должна быть направлена на профилактику заболеваний и соответственно, на излечение больных на первичном уровне.



Для обеспечения профилактических и реабилитационных мероприятий разрабатывается комплекс программ, обладающих WEB-интерфейсом и соответственно доступных любому пользователю ПК, имеющему выход в
INTERNET. На основе вводимой информации, содержащей историю болезни пациента, система определяет принадлежность человека к той или иной группе риска, и формирует рекомендации по поддержанию здоровья.
Создаваемая экспертная система предоставит врачам центральных районных больниц информацию о предполагаемом диагнозе и о сопутствующих диагнозах, осложнениях, аллергиях и прочем, а также информацию об оптимальном подборе лекарственных средств на основе данных. Также возможности системы позволят пациентам самим определить предрасположенность к тем или иным заболеваниям и получить рекомендации для предотвращения болезни еще до ее возникновения [3].
Данная диагностическая система позволит врачам на первичном уровне с большой точностью диагностировать заболевания и назначать перечень лечебных, профилактических и реабилитационных мероприятий даже для диагнозов, имеющих слабо выраженную симптоматику.
Таким образом, разрабатываемая система позволит на первичном уровне обеспечить снижение уровня заболеваний населения без привлечения специализированного и высокотехнологичного медицинского оборудования краевого уровня.
Литература
1.
Шайдуров А.А., Зацепин П.М., Шатохин А.С., Пиянзин А.И.,
Акинина З.Ф. Нейросетевой диагностический комплекс с элементами автоматической модификации // Нейроинформатика и ее приложения:
Материалы XII Всероссийского семинара. Красноярск, 2004. с. 171-172.
2.
Интеллектуальные информационные системы: учеб. пособие/А.А. Смагин, С.В. Липатова, А.С. Мельниченко. -Ульяновск: УлГУ,
2010,-136 с.
3.
Бубликов
А.С.,
Шайдуров
А.А.
Анализ применения искусственных нейронных сетей для построения медицинских экспертных систем // Ломоносовские чтения на алтае: фундаментальные проблемы науки и образования, Барнаул, 11-14 ноября 2014 г. Барнаул, 2014. С. 591-594.
1   2   3   4


База данных защищена авторским правом ©nethash.ru 2019
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал