Algorithms
В статье рассматриваются неориентированные кратные графы произвольной натуральной кратности $k>1$. Кратный граф содержит ребра трех типов: обычные, кратные и мультиребра. Ребра последних двух типов представляют собой объединение $k$ связанных ребер, которые соединяют 2 или $(k+1)$ вершину соответственно. Связанные ребра могут использоваться только согласованно. Если вершина инцидентна кратному ребру, то она может быть инцидентна другим кратным ребрам, а также она может быть общим концом $k$ связанных ребер мультиребра. Если вершина является общим концом мультиребра, то она не может быть общим концом никакого другого мультиребра. Как и для обычного графа, для кратного графа можно ввести целочисленную функцию длины ребра и поставить задачу о кратчайшем пути между двумя вершинами. Кратный путь является объединением $k$ обычных путей, согласованных на связанных ребрах кратных и мультиребер. В статье оптимизирован полученный ранее алгоритм поиска кратчайшего пути в произвольном кратном графе. Показано, что оптимизированный алгоритм полиномиален. Таким образом, задача о кратчайшем пути является полиномиальной для любого кратного графа.
Computer System Organization
В работе рассмотрена задача моделирования информационного обмена адаптивной системы управления движением группы беспилотных летательных аппаратов (БЛА). Движение группы БЛА осуществляется в соответствии с адаптивным алгоритмом оптимального управления пространственной перестройкой. Оптимальные управления строятся обеспечивающими минимум общей затрачиваемой энергии. Параметры математической модели движения группы БЛА уточняются в процессе полета в соответствии с изменяющимися внешними условиями. В соответствии с этим уточняются управляющие воздействия. Это требует значительных вычислительных ресурсов и накладывает особые требования на систему информационного обмена между БЛА и пунктом управления. Предложена схема информационного обмена между БЛА и пунктом управления, позволяющая рассчитать оптимальные параметры передающих устройств.
Discrete Mathematics in Relation to Computer Science
Численное исследование различных процессов приводит к необходимости уточнения (расширения) границ применимости вычислительных конструкций и инструментов моделирования. В настоящей статье изучается дифференцируемость в пространстве интегрируемых по Лебегу функций и рассматривается согласованность этого понятия с основополагающими вычислительными построениями такими, как разложение Тейлора и конечные разности. Функцию $f$ из $L_1[a;b]$ назовём $(k,L)$-дифференцируемой в точке $x_0$ из $(a;b),$ если существует алгебраический многочлен $P,$ степени не выше $k,$ такой, что интеграл по отрезку от ${x_0}$ до ${x_0+h}$ для $f-P$ есть $o(h^{k+1}).$ Найдены формулы для вычисления коэффициентов такого $P,$ представляющие собой предел отношения интегральных модификаций конечных разностей $ {\bf\Delta}_h^m(f,x) $ к $ h^m\!, \; m=1, \cdots, k. $ Получается, что если $f\!\in\!W_1^{l}[a; b],$ и $f^{(l)}$ является $(k,L)$-диффе\-ренци\-руемой в точке $x_0,$ то $f$ приближается тейлоровским многочленом с точностью $ o\big((x{-}x_0)^{l+k}\big),$ а коэффициенты разложения могут быть найдены указанным выше способом. Для исследования функций из $L_1$ на множестве применяется дискретная «глобальная» конструкция разностного выражения: на основе частного ${\bf\Delta}_h^m(f, \cdot)$ и $h^m$ строится последовательность $\big{{\bf\Lambda}_n^m[f]\big}$ кусочно-постоянных функций, подчинённых разбиениям полуинтервала $[a; b)$ на $n$ равных частей. Показано, что для $(k,L)$-диффе\-ренци\-руемой в точке $x_0$ функции $f$ последовательности $\big{{\bf\Lambda}_n^m[f]\big},\; m=1,\cdots, k, $ сходятся при $n\to \infty$ в этой точке к коэффициентам приближающего в ней функцию многочлена. С помощью $\big{{\bf\Lambda}_n^k[f]\big}$ устанавливается теорема: {\it «$f$ из $L_1[a;b]$ принадлежит $C^k[a;b] \Longleftrightarrow $ $f$ равномерно $(k,L)$-диффе\-рен\-цируе\-ма на $[a;b]$».} Отдельное место занимает изучение построений, соответствующих случаю $m\!=\!0.$ Их рассматриваем в $L_1[Q_0],$ где $Q_0$ -- куб в пространстве $\mathbb R^d.$ По заданной функции $ f\!\in\!L_1$ и разбиению $\tau_{n}$ полузамкнутого куба $Q_0$ на $\;n^d$ равных полузамкнутых кубов построим кусочно-постоянную функцию $\Theta_n[f]$, определяемую как интегральное среднее $f$ на каждом кубе $Q\!\in\!\tau_{n}.$ Данная вычислительная конструкция приводит к следующим теоретическим фактам: {\it 1) $f$ из $L_1 $ принадлежит $L_p, 1 \le p < \infty, \Longleftrightarrow \big{\Theta_n[f]\big}$ сходится в $L_p;$ ограниченность $\big{\Theta_n[f]\big} \; \Longleftrightarrow f\!\in\!L_\infty;$ 2) последовательности $\big{\Theta_n[\cdot]\big}$ определяют на классах эквивалентности оператор-проектор $\Theta$ в пространстве $L_1;$ 3) для функции $f\!\in\!L_{\infty}$ получаем $ \overline{\Theta [f]}\!\in\!B,$ где $B$ -- это пространство ограниченных функций, а $ \overline{\Theta [f]}$ -- доопределённая на множестве меры ноль функция $ \Theta [f](x),$ и выполняется равенство $\;\big\Vert \overline{\Theta [f]}\big\Vert_{B} = \Vert f\Vert_{\infty}.$ } Таким образом, в семействе пространств $L_p$ можно заменить $L_{\infty}[Q_0]$ на $B[Q_0].$
Theory of Computing
Разработка программного обеспечения зачастую связана с расширением функциональности. Для повышения надежности в этом случае необходимо минимизировать изменение ранее написанного кода. Для инструментальной поддержки эволюционной разработки программ была предложена процедурно-параметрическая парадигма программирования, что позволило повысить возможности процедурного подхода. Это обеспечивает безболезненное расширение как данных, так функций, используя при этом статическую типизацию. В работе рассматривается включение процедурно-параметрического программирования в язык C. Предлагаются дополнительные синтаксические конструкции, ориентированные на поддержку предлагаемого подхода. К ним относятся: параметрические обобщения, специализации обобщений, обобщающие функции, обработчики специализаций. Описываются их семантика, возможности и особенности технической реализации. Для проверки возможностей использования данного подхода построены модели процедурно-параметрических конструкций на языке программирования C. Приведенный пример демонстрирует гибкое расширение программы и поддержку множественного полиморфизма.
Theory of Data
Задача распознавания именованных сущностей (named entity recognition, NER) состоит в выделении и классификации слов и словосочетаний, обозначающих именованные объекты, таких как люди, организации, географические названия, даты, события, обозначения терминов предметных областей. В поисках лучшего решения исследователи проводят широкий спектр экспериментов с разными технологиями и исходными данными. Сравнение результатов этих экспериментов показывает значительное расхождение качества NER и ставит проблему определения условий и границ применения используемых технологий, а также поиска новых путей решения. Важным звеном в ответах на эти вопросы является систематизация и анализ актуальных исследований и публикация соответствующих обзоров. В области распознавания именованных сущностей авторы аналитических статей в первую очередь рассматривают математические методы выделения и классификации и не уделяют внимание специфике самой задачи. В предлагаемом обзоре область распознавания именованных сущностей рассмотрена с точки зрения отдельных категорий задач. Авторы выделили пять категорий: классическая задача NER, подзадачи NER, NER в социальных сетях, NER в предметных областях, NER в задачах обработки естественного языка (natural language processing, NLP). Для каждой категории обсуждается качество решения, особенности методов, проблемы и ограничения. Информация об актуальных научных работах каждой категории для наглядности приводится в виде таблицы, содержащей информацию об исследованиях: ссылку на работу, язык использованного корпуса текстов и его название, базовый метод решения задачи, оценку качества решения в виде стандартной статистической характеристики F-меры, которая является средним гармоническим между точностью и полнотой решения. Обзор позволяет сделать ряд выводов. В качестве базовых технологий лидируют методы глубокого обучения. Основными проблемами являются дефицит эталонных наборов данных, высокие требования к вычислительным ресурсам, отсутствие анализа ошибок. Перспективным направлением исследований в области NER является развитие методов на основе обучения без учителя или на основе правил. Возможной базой предобработки текста для таких методов могут служить интенсивно развивающиеся модели языков в существующих инструментах NLP. Завершают статью описание и результаты экспериментов с инструментами NER для русскоязычных текстов.
Статья посвящена построению корпуса предложений, размеченных по общей тональности на 4 класса (положительный, отрицательный, нейтральный, смешанный), корпуса фразеологизмов, размеченных по тональности на 3 класса (положительный, отрицательный, нейтральный), и корпуса предложений, размеченных по наличию или отсутствию иронии. Разметку проводили волонтёры в рамках проекта «Готовим тексты алгоритмам» на портале «Люди науки». На основе имеющихся знаний о предметной области для каждой из задач были составлены инструкции для разметчиков. Также была выработана методика статистической обработки результатов разметки, основанная на анализе распределений и показателей согласия оценок, выставленных разными разметчиками. Для разметки предложений по наличию иронии и фразеологизмов по тональности показатели согласия оказались достаточно высокими (доля полного совпадения 0.60--0.99), при разметке предложений по общей тональности согласие оказалось слабым (доля полного совпадения 0.40), по-видимому, из-за более высокой сложности задачи. Также было показано, что результаты работы автоматических алгоритмов анализа тональности предложений улучшаются на 12--13 % при использовании корпуса, относительно предложений которого сошлись мнения всех разметчиков (3--5 человек), по сравнению с корпусом с разметкой только одним волонтёром.
ISSN 2313-5417 (Online)