Проблемы современности в области машинного обучения (нейронные сети) и пути решения

Модель машинного обучения

 

Машинное обучение (МО) – область науки, изучающая поиск скрытых зависимостей в больших данных.

Входные данные        ⇒        Нейронная сеть         ⇒           Результат

Общая схема модели МО выглядит вот так,

Например, стоит задача обучить нейросеть определять на изображения кошку.  Для этого собираем вручную10 млн. изображений с котиком и классифицируем (1- если котик присутствует на изображении,  0- если нет).

В режиме работы машинного обучения с учителем подготовленную вручную обучающую выборку  передаем в нейронную сеть, после прохождения данных через скрытые слои нейронов для каждого изображения указывается результат.

Сбор вручную 10 млн. изображений и их классификация – ручная работа, на которую уходит n-ое количество человеко-часов.  На это мы не можем повлиять. Оставляем как есть.

Обучение нейронной сети – вычислительный процесс, на выполнение которого уходит m-ное количество машинных часов.  Мы предлагаем путь позволяющий сократить это время вне зависимости от математической модели нейросети. Ниже рассмотрим проблемы, их пути их решения.

Ограничения вычислений нейронных сетей

Последовательная обработка данных при обучении и штатной работы

Причины:

  • Ограничения, наложенные стандартами используемых языков программирования (Phyton, C# и т.п.) в очень тяжелой реализации распараллеливания процессов;
  • Ограничения, связанные с передачей параметров при интеграции программ написанных на различных языках программирования, а именно из-за отсутствия поддерживаемых типов данных одного языка в другом.

Низкая скорость работы нейронной сети на этапах обучения и штатной работы

Причина – ограничение связанные с аппаратной мощностью одного ПК, на которой нейронная сеть размещена.

Что необходимо сделать

Необходимо разработать инструмент (язык программирования), позволяющий быстро, качественно и соответственно дешевле решать задачи слабого искусственного интеллекта, написания экспертных систем и хранения баз знаний.

Мы предлагаем создать язык программирования с расширяемыми библиотеками (VD neural networks, VD Graph, VD Vector) для быстрой и качественной работы нейронных сетей, генетических алгоритмов, алгоритмов нечеткой логики, экспертных систем, умных агентов.

Пути достижения:

  1. Использование функционального и декларативного подхода при создании языка программирования;
  2. Распараллеливание процессов обработки;
  3. Создание возможности работы нейронной сети в группе ПК (в локальной сети) и использование всей вычислительной мощи каждого ПК, участвующего в обработке входных данных.

Ожидаемые результаты

  • Легкая интеграция наших библиотек VD в существующие языки программирования (C, Phyton, JavaScript и др.);
  • Увеличение скорости машинного обучения и работы нейросети в разы;
  • Удешевление стоимости разработки, отладки и поиска оптимальной модели машинного обучения в разы (точная цифра зависит от результатов тестирования) за счет экономии времени.

 

Общий итог — экономия времени и соответственно затрат

Дедлайн

  Октябрь 2018 года.

 

По вопросам о ходе разработки проекта, можете связаться с нами по телефону: +7 (831) 296-18-22 или написать письмо на info@lumen18.com .