<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">Forestry Engineering Journal</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">Forestry Engineering Journal</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Лесотехнический журнал</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="print">2222-7962</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">36315</article-id>
   <article-id pub-id-type="doi">10.34220/issn.2222-7962/2020.1/19</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>Технологии. Машины и оборудование</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject>TECHNOLOGIES. MACHINERY AND EQUIPMENT</subject>
    </subj-group>
    <subj-group>
     <subject>Технологии. Машины и оборудование</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">APPLICATION OF LEARNING REINFORCEMENT METHOD IN ROBOTIZED AND AUTOMATED FORESTRY SYSTEMS</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>ПРИМЕНЕНИЕ МЕТОДА ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ В РОБОТОТИЗИРОВАННЫХ И АВТОМАТИЗИРОВАННЫХ СИСТЕМАХ ЛЕСНОЙ ПРОМЫШЛЕННОСТИ</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Толстых</surname>
       <given-names>Андрей Андреевич</given-names>
      </name>
      <name xml:lang="en">
       <surname>Tolstyh</surname>
       <given-names>Andrey Andreevich</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Ступников</surname>
       <given-names>Дмитрий Сергеевич</given-names>
      </name>
      <name xml:lang="en">
       <surname>Stupnikov</surname>
       <given-names>Dmitriy Sergeevich</given-names>
      </name>
     </name-alternatives>
     <email>Neiti1992@yandex.ru</email>
     <xref ref-type="aff" rid="aff-2"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Малюков</surname>
       <given-names>Сергей Владимирович</given-names>
      </name>
      <name xml:lang="en">
       <surname>Malyukov</surname>
       <given-names>Sergey Vladimirovich</given-names>
      </name>
     </name-alternatives>
     <email>malyukovsergey@yandex.ru</email>
     <bio xml:lang="ru">
      <p>кандидат технических наук;</p>
     </bio>
     <bio xml:lang="en">
      <p>candidate of technical sciences;</p>
     </bio>
     <xref ref-type="aff" rid="aff-3"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Лукьянов</surname>
       <given-names>Александр Сергеевич</given-names>
      </name>
      <name xml:lang="en">
       <surname>Luk'yanov</surname>
       <given-names>Aleksandr Sergeevich</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-4"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Лунев</surname>
       <given-names>Юрий Станиславович</given-names>
      </name>
      <name xml:lang="en">
       <surname>Lunev</surname>
       <given-names>Yuriy Stanislavovich</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-5"/>
    </contrib>
   </contrib-group>
   <aff-alternatives id="aff-1">
    <aff>
     <institution xml:lang="ru">Воронежский институт МВД России</institution>
     <country>Россия</country>
    </aff>
    <aff>
     <institution xml:lang="en">Воронежский институт МВД России</institution>
     <country>Russian Federation</country>
    </aff>
   </aff-alternatives>
   <aff-alternatives id="aff-2">
    <aff>
     <institution xml:lang="ru">Воронежский государственный лесотехнический университет имени Г.Ф. Морозова</institution>
     <country>Россия</country>
    </aff>
    <aff>
     <institution xml:lang="en">Voronezh State University of Forestry and Technologies</institution>
     <country>Russian Federation</country>
    </aff>
   </aff-alternatives>
   <aff-alternatives id="aff-3">
    <aff>
     <institution xml:lang="ru">Воронежский государственный лесотехнический университет имени Г.Ф. Морозова</institution>
     <country>Россия</country>
    </aff>
    <aff>
     <institution xml:lang="en">Voronezh State University of Forestry and Technologies</institution>
     <country>Russian Federation</country>
    </aff>
   </aff-alternatives>
   <aff-alternatives id="aff-4">
    <aff>
     <institution xml:lang="ru">Воронежский институт МВД России</institution>
     <country>Россия</country>
    </aff>
    <aff>
     <institution xml:lang="en">Воронежский институт МВД России</institution>
     <country>Russian Federation</country>
    </aff>
   </aff-alternatives>
   <aff-alternatives id="aff-5">
    <aff>
     <institution xml:lang="ru">Воронежский институт МВД России</institution>
     <country>Россия</country>
    </aff>
    <aff>
     <institution xml:lang="en">Воронежский институт МВД России</institution>
     <country>Russian Federation</country>
    </aff>
   </aff-alternatives>
   <volume>10</volume>
   <issue>1</issue>
   <fpage>256</fpage>
   <lpage>265</lpage>
   <self-uri xlink:href="http://lestehjournal.ru/sites/default/files/journal_pdf/256-265.pdf">http://lestehjournal.ru/sites/default/files/journal_pdf/256-265.pdf</self-uri>
   <abstract xml:lang="ru">
    <p>В настоящее время на большинстве крупных предприятий активно используются промышленные роботы и другие автоматизированные решения. Это позволяет в значительной степени повысить производительность и качество выполняемых работ. В данной статье был дан краткий обзор современных промышленных роботов, их принцип работы, основные узлы и системы. Был разработан и протестирован алгоритм обучения с подкреплением. Задача построения алгоритма обучения с подкреплением была разделена на два этапа: моделирование среды и описание и оптимизация функции стоимости. Так как промышленные робототехнические системы работают в реальном мире, модель окружения должна отражать основные физические законы. Поэтому в качестве физической среды для тестирования была выбрана библиотека физического окружения pyBullet. После моделирования манипулятора в выбранной физической среде, перед ним была поставлена тривиальная задача касание захватом манипулятора заданного объекта. В качестве агента, взаимодействующего со средой, использовалась искусственная нейронная сеть. Входами служили координаты объекта и существующие углы поворотов шарнирных сочленений робота. Выходами – угол поворота сочленений на данном шаге. Данная сеть обучалась методом обратного распространения ошибки, модификацией Adam. Система обучалась около 12 часов. При тестировании устойчивости системы (случайное положение цилиндра), успех достигается в 95% случаев. В дальнейшем планируется тестирование полученных моделей на стендовых образцах</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>Abstract&#13;
Currently, most large enterprises are actively using industrial robots and other automated solutions. This allows a significant increase in productivity and quality of work performed. This article gave a brief overview of modern industrial robots, their operating principle, basic components and systems. A reinforcement learning algorithm was developed and tested. The task of constructing a learning algorithm with reinforcement was divided into two stages: modeling the environment and description and optimization of the cost function. Since industrial robotic systems operate in the real world, the environment model should reflect basic physical laws. Therefore, the pyBullet library of the physical environment was chosen as the physical environment for testing. After modeling the manipulator in the selected physical medium, it was given the trivial task of touching a given object with the capture of the manipulator. An artificial neural network was used as an agent interacting with the environment. The inputs were the coordinates of the object and the existing angles of rotation of the articulated joints of the robot. Outputs - angle of rotation of joints at this step. This network was trained using the back propagation method, Adam modification. The system was trained for about 12 hours. Success is achieved in 95% of cases when testing the stability of the system (random position of the cylinder). In future, it is planned to test the obtained models on bench samples</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>промышленный робот</kwd>
    <kwd>нейронная сеть</kwd>
    <kwd>алгоритм</kwd>
    <kwd>обучение с подкреплением</kwd>
    <kwd>автоматизация</kwd>
    <kwd>робот-манипулятор</kwd>
   </kwd-group>
   <kwd-group xml:lang="en">
    <kwd>industrial robot</kwd>
    <kwd>neural network</kwd>
    <kwd>algorithm</kwd>
    <kwd>reinforcement learning</kwd>
    <kwd>automation</kwd>
    <kwd>robot-manipulator</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p>Введение В настоящее время практически все крупные предприятия любой промышленной сферы стараются использовать множество различных автоматизированных решений. При использовании подобных средств человеческий фактор практически полностью исключается из производственного процесса. В лесной промышленности подобная тенденция тоже прослеживается. Начиная от полуавтоматизированных лесозаготовительных комплексов по типу харвестера от john deere, заканчивая автоматизированными станками с ЧПУ и манипуляторами для погрузки хлыстов и сортимента. Использование такого рода техники позволяет в значительной степени повысить производительность и качество выполняемых работ, а также сократить количество используемой техники [2].В данной статье хотелось бы затронуть вопрос современных промышленных роботов, их возможности, структуру, а также программную составляющую для их управления. Также приведем некоторые исследования в данной области. Материал и методы исследованияЗачастую промышленный робот представляется в антропоморфной форме (аналог человеческой руки). Подобная структура является наиболее популярной и неспроста. Это позволяет сделать конструкцию более универсальной и иметь несколько степеней свободы (обычно от 4-х и более). В промышленной сфере большим спросом пользуются полностью автоматизированные роботы-манипуляторы, которые выполняют определенный спектр поставленных задач при помощи алгоритмов и разного рода датчиков. Такие роботы могут сами принимать решения, но все они будут в рамках прописанных алгоритмом. Однако специфика и спектр различных применений промышленных роботов подразумевает разработку и создание промышленных роботов с использованием нейронных сетей, способных моделировать свое виртуальное пространство, в котором могут ориентироваться и принимать решения о последующих действиях. Такие роботы могут обучаться сами, по мере поступления опыта [1]. Яркими примерами являются промышленные роботы фирмы KUKA и AMAZON (рис. 1).Конструкцию современного промышленного робота можно разделить на две основные части: механическую и аппаратную.Механическая часть, включает в себя звенья манипулятора, систему приводов и т.д. Аппаратная часть, включает в себя систему управления приводами механической части, а также информационно-сенсорную систему, которая обеспечивает робот необходимой вводной информацией. Объем и сложность аппаратной части во многом зависит от области использования того или иного робота.Функциональная схема робота-манипулятора показана на рисунке 2.Исполнительным механизмом манипулятора обычно является открытая кинематическая цепь. При этом каждое звено цепи соединяется  последовательно между собой вращательными либо поступательными сочленениями.   а) б)Рис. 1. Антропоморфные роботы – манипуляторы: а) образец компании KUKA; Источник: компания KUKA. – URL: https://www.kuka.com/ б) образец компании AMAZON. Источник: Amazon полностью заменит работу человека роботом на промышленных предприятиях. – URL: https://versiya.info/tehnika-i-tehnologii/101175/amp           Рис. 2. Функциональная схема робота-манипулятора: 1 – неподвижная опора; 2 – электродвигатель; 3 – опорное вращательное звено; 4 – возвратно-поступательные звенья; 5 – захватИсточник: собственная разработка авторов  Количество степеней свободы, а также рабочая область промышленного робота будет зависеть от взаимного расположения и комбинации звеньев (рис. 3).В большинстве случаев в исполнительном механизме робота-манипулятора первые три звена осуществляют транспортные функции. Они обеспечивают смещение рабочего органа в необходимое положение. Все остальные сочленения выполняют ориентирующую функцию, направляя рабочий орган согласно поставленной задаче [3].Ниже представлены четыре категории промышленных роботов, которые делятся в зависимости от вида первых трёх сочленений:роботы, у которых все три начальных сочленения являются поступательными (они работают в декартовой системе координат);роботы, у которых среди начальных сочленений два поступательных и одно вращательное (они работают в цилиндрической системе координат);роботы, у которых среди начальных сочленений одно поступательных и два вращательных (они работают в сферической системе координат);роботы, у которых все три начальных сочленения являются вращательными (они работают в угловой, или вращательной, системе координат).Разделение степеней подвижности у некоторых промышленных роботов на переносные и ориентирующие не предусмотрено. В качестве примера можно привести роботов, с числом степеней свободы более шести (избыточная кинематика).Рабочий орган – устройство, которое предназначено для реализации конкретной производственно задачи. Он размещается на последнем звене робота-манипулятора. В качестве рабочего органа могут выступать как универсальные устройства по типу захватов, так и профильные инструменты. Схват – устройство, захватывающее и удерживающее объект посредством относительного перемещения частей данного устройства. Он является одним из самых универсальных видов захватного устройства. Схват по конструкции напоминает человеческую кисть: захват объектов производится при помощи механических «пальцев» [1, 3]. Электрические, пневматические или гидравлические двигатели применяют в качестве привода. Электрические приводы способствуют выполнению более точных операций.  При этом гидравлические приводы используют для более тяжелых работ, где необходимо развивать высокое быстродействие или большое усилие. В свою очередь, пневматические приводы применяют на малогабаритных роботах для выполнения простых цикличных операций. Основным элементов аппаратной части является силовой преобразователь – драйвер двигателя. Для управления электродвигателями постоянного тока используют некоторое количество схем. Самой функциональной из всех является Н–мост. Общая схема Н-моста изображена на рисунке 4.Показанная схема содержит четыре ключа. Они включены попарно последовательно. Между парами располагается двигатель (якорная цепь). Два нижних ключа подключаются к отрицательной шине источника питания, два верхних ключа – к положительной шине источника питания. Для включения двигателя необходимо, чтобы были включены два ключа, допустим S1 и S4, в данном случае ток будет протекать от источника питания через ключ S1, далее через якорь двигателя и через ключ S4, а два другие ключа должны быть закрыты. Для того чтобы реверсировать движение тока,  тока в якоре двигателя необходимо закрыть ключи S1 и S4, а ключи S2 и S3 открыть [3].В наши дни предъявляются все большие требования к универсальности алгоритмов, используемых для управления промышленными робототехническими системами. В настоящее время наиболее перспективным подходом является применение обучения с подкреплением [4, 5]. Рассмотрим подробнее данный подход.В литературе [4] используются термины «агент» и «среда» – для обозначения робототехнической системы и внешних факторов соответственно. Вся концепция подхода строиться на утверждении, что существует функция стоимости [5], зависящая от предыдущих действий агента и состояния среды, которая может быть рассчитана в каждый момент времени и ее максимизация влечет за собой выполнение поставленной перед робототехнической системой задачи.На рисунке 5 приведена схема процесса обучения с подкреплением.   Рис. 3. Схема робота-манипулятора с обозначением степеней свободы [2, 3] Рис. 4. Общая схема Н-моста [2, 3] Рис. 5. Схема обучения с подкреплениемИсточник: собственная разработка авторов Рeзультaты иccлeдoвaния и их oбсуждeниеТехнически наиболее сложным является математическое описание функции стоимости, в то время как задача её оптимизации может быть решена с помощью численных методов оптимизации. Рассмотрим подробнее механизм определения функции стоимости.Введем к уже используемым обозначениям переменную  , определяющую взвешенную сумму ранее полученных наград к шагу t [4]. Она определяется как  где   – коэффициент, обеспечивающий снижение значения последних действий. Подобная формулировка необходима для увеличения количества действий, приводящих к положительному результату. Данное выражение справедливо для случая, когда действия последовательны, то есть у агента нет выбора. Для случая выбора из K действий на каждом шаге: где  – ранее полученные награды к шагу t, при текущем состоянии среды S;   – вероятность перехода среды в состояние Sk, при выборе действия k. Заключительным изменением данной формулировки является введение «политики» [6]. Под политикой ( ) понимается стратегия принятия решения выбора конкретного действия в текущем состоянии среды: где a – все доступные для агента действия;   – текущая политика.Задача построения алгоритма обучения с подкреплением делится на два этапа: моделирование среды и описание и оптимизация функции стоимости. Так как промышленные робототехнические системы работают в реальном мире, модель окружения должна отражать основные физические законы. Проведя анализ доступных физических окружений – библиотек, использующих просчет физики для инженерных целей, были выделены две библиотеки: MuJoCo [7, 8] и pyBullet [9]. Данные библиотеки фундаментально не отличаются между собой – только разные подходы к описанию логики и ценовая политика. Было принято решение использование в качестве физического окружения pyBullet ввиду его бесплатной модели распространения. Для реализации среды был смоделирован промышленный робот, соответствующая физическая среда и объекты, на которые робот должен воздействовать (рис. 6). Таким образом, первый этап построения модели обучения с подкреплением можно считать выполненным.Была выбрана тривиальная задача касание захвата манипулятора заданного объекта (на рисунке 6 зеленый цилиндр). В качестве функции стоимости выступало следующее выражение: где, C – координаты цели (цилиндра); T – координаты захвата робота; t – текущий шаг. Деление на t обусловлено условием минимизации количества действий робота: чем больше шагов пройдено – тем меньше награда на текущем шаге. Функция стоимости определяется как максимизация награды  , где W – параметры модели.В качестве агента, взаимодействующего со средой, использовалась искусственная нейронная сеть [10]. Использовалась простейший персептрон с 2 скрытыми слоями. Входами служили координаты объекта и существующие углы поворотов шарнирных сочленений робота. Выходами – угол поворота сочленений на данном шаге. Архитектура искусственной нейронной сети приведена на рисунке 7.Данная архитектура была выбрана из эмпирических соображений [11], подбор гиперпараметров не производился.Данная сеть обучалась методом обратного распространения ошибки, модификацией Adam [10]. Система обучалась около 12 часов. При тестировании устойчивости системы (случайное положение цилиндра), успех достигается в 95% случаев. Следует отметить, что для применения системы требуется 4 операции матричного перемножения, 4 операции матричного сложения и 3 операции поэлементного применения нелинейной функции. Данное количество операций уже учитывает моделируемые физические условия. Увеличение конечной точности системы может быть достигнуто за счет подбора гиперпараметров и увеличения времени обучения.На рисунке 8 приведены графики изменения ошибки обучения в зависимости от эпохи. Под эпохой обучения понимается одно изменение весов ИНС [10].Из рисунка видно, что после 500 эпох обучения появляется участок с флуктуациями ошибки. Это связано с тем, что ИНС обучается на случайно сгенерированных примерах, обобщая полученную информацию. После 1500 эпохи целесообразно прекратить обучение, так как достигнута квазиоптимальная конфигурация ИНС.Выводы. По результатам проведенных теоретических исследований было выявлено, что данный метод показывает высокий процент реализации поставленной задачи (95%). В дальнейшем планируется тестирование данных моделей на стендовых образцах.      Рис. 6. Рендеринг физического окружения pyBullet для робота-манипулятораИсточник: собственная разработка авторов в рендеринге физического окружения pyBullet       Полносвязный слой 32 Выходной слой 5  Полносвязный слой 8  Полносвязный слой 64          Рис. 7. Архитектура агента, выполненного в виде искусственной нейронной сети Источник: собственная разработка авторов  Рис. 8. Графики изменения ошибки обучения в зависимости от эпохиИсточник: собственная разработка авторов</p>
 </body>
 <back>
  <ref-list>
   <ref id="B1">
    <label>1.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Лекции. Классификации систем координат. - URL: http://baumanki.net/lectures/ (дата обращения 17.10.2019).</mixed-citation>
     <mixed-citation xml:lang="en">Lekcii. Klassifikacii sistem koordinat. - URL: http://baumanki.net/lectures/ (data obrascheniya 17.10.2019).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B2">
    <label>2.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Анализ современного состояния применения роботов в промышленности. - URL: https://ru.wikipedia.org/wiki (дата обращения 17.10.2019).</mixed-citation>
     <mixed-citation xml:lang="en">Analiz sovremennogo sostoyaniya primeneniya robotov v promyshlennosti. - URL: https://ru.wikipedia.org/wiki (data obrascheniya 17.10.2019).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B3">
    <label>3.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Схиртладзе, А.Г. Классификация и структура промышленных роботов / А. Г. Схиртладзе, В. И. Выходец, Н. И. Никифоров. - URL: http://www.metal-working.ru/ (дата обращения 17.10.2019).</mixed-citation>
     <mixed-citation xml:lang="en">Shirtladze, A.G. Klassifikaciya i struktura promyshlennyh robotov / A. G. Shirtladze, V. I. Vyhodec, N. I. Nikiforov. - URL: http://www.metal-working.ru/ (data obrascheniya 17.10.2019).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B4">
    <label>4.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Саттон, Р.С. Обучение с подкреплением / Р.С. Саттон, Э.Г. Барто. - М.: Бином. Лаборатория знаний, 2017. - 399 с.</mixed-citation>
     <mixed-citation xml:lang="en">Satton, R.S. Obuchenie s podkrepleniem / R.S. Satton, E.G. Barto. - M.: Binom. Laboratoriya znaniy, 2017. - 399 s.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B5">
    <label>5.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Wang, Z. Dueling Network Architectures for Deep Reinforcement Learning / Z. Wang, T. Schaul, M. Hessel, H. van Hasselt, M. Lanctot, N. de Freitas // CoRR. - abs/1511.06581. - 2016. - pp. 1-15.</mixed-citation>
     <mixed-citation xml:lang="en">Wang, Z. Dueling Network Architectures for Deep Reinforcement Learning / Z. Wang, T. Schaul, M. Hessel, H. van Hasselt, M. Lanctot, N. de Freitas // CoRR. - abs/1511.06581. - 2016. - pp. 1-15.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B6">
    <label>6.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Sutton, R.S. Policy Gradient Methods for Reinforcement Learning with Function Approximation / R.S. Sutton, D.A. McAllester, S.P. Singh, M. Yishay // Advances in Neural Information Processing Systems 12. - 2000. - pp. 1057-1063.</mixed-citation>
     <mixed-citation xml:lang="en">Sutton, R.S. Policy Gradient Methods for Reinforcement Learning with Function Approximation / R.S. Sutton, D.A. McAllester, S.P. Singh, M. Yishay // Advances in Neural Information Processing Systems 12. - 2000. - pp. 1057-1063.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B7">
    <label>7.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">MuJoCo advanced physics simulation. - URL: http://www.mujoco.org/ (дата обращения: 18.10.2019).</mixed-citation>
     <mixed-citation xml:lang="en">MuJoCo advanced physics simulation. - URL: http://www.mujoco.org/ (data obrascheniya: 18.10.2019).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B8">
    <label>8.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Todorov, E. A physics engine for model-based control / E. Todorov, T. Erez, Y. Tassa, MuJoCo // IROS. - 2012. - pp. 5026-5033. - DOI: 10.1109/IROS.2012.6386109.</mixed-citation>
     <mixed-citation xml:lang="en">Todorov, E. A physics engine for model-based control / E. Todorov, T. Erez, Y. Tassa, MuJoCo // IROS. - 2012. - pp. 5026-5033. - DOI: 10.1109/IROS.2012.6386109.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B9">
    <label>9.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Bullet Real-Time Physics Simulation. - URL: https://pybullet.org/wordpress/ (дата обращения: 18.10.2019).</mixed-citation>
     <mixed-citation xml:lang="en">Bullet Real-Time Physics Simulation. - URL: https://pybullet.org/wordpress/ (data obrascheniya: 18.10.2019).</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B10">
    <label>10.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Гудфеллоу Я. Глубокое обучение [Текст] / Я. Гудфеллоу, И. Бенджио, А. Курвилль. - Москва: «ДМК Пресс», 2017. - 652 с.</mixed-citation>
     <mixed-citation xml:lang="en">Gudfellou Ya. Glubokoe obuchenie [Tekst] / Ya. Gudfellou, I. Bendzhio, A. Kurvill'. - Moskva: «DMK Press», 2017. - 652 s.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B11">
    <label>11.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Толстых, А.А. Выбор архитектуры искусственной нейронной сети на основе сравнения эффективности методов распознавания изображений / А.А. Толстых, А.Н. Голубинский // Вестник Воронежского института МВД России.  - 2018. - № 1. - C. 27-37.</mixed-citation>
     <mixed-citation xml:lang="en">Tolstyh, A.A. Vybor arhitektury iskusstvennoy neyronnoy seti na osnove sravneniya effektivnosti metodov raspoznavaniya izobrazheniy / A.A. Tolstyh, A.N. Golubinskiy // Vestnik Voronezhskogo instituta MVD Rossii.  - 2018. - № 1. - C. 27-37.</mixed-citation>
    </citation-alternatives>
   </ref>
  </ref-list>
 </back>
</article>
