Новосибирский государственный университет
Лаборатория аналитики потоковых данных и машинного обучения
Лаборатория аналитики потоковых данных и машинного обучения (ЛАПДиМО) Механико-математического факультета НГУ создана в декабре 2015 года.
Задачи лаборатории:
- применение современных методов глубинного обучения для создания технологий и технических решений по видеонаблюдению, распознаванию речи, мониторингу социальных сетей и идентификации личности;
- разработка новых методов высокоскоростной от 100 ГБит/с интеллектуальной обработки сетевого трафика с использованием GPU и FPGA;
- развитие прикладных методов анализа больших данных в области обработки естественных языков, распознавания речи, распознавания изображений;
- создание квантово-статистической теории измерений для машинного обучения;
- развитие методологии FRiS анализа данных и её техническое воплощение.
Проекты лаборатории
- Разработка аналитических инструментов потоковой обработки данных. Заказчик — ООО «Сигнатек».
- Магистерская программа “Big Data Analytics” (на английском языке)
- Курсы повышения квалификации «Аналитика больших данных для бизнес-задач» в партнёрстве с ООО «Экспасофт». За 2015-2017 гг. обучено 50 специалистов.
- Проведение международной конференции IEEE Siberian Symposium on Data Science and Engineering (SSDSE) 14 апреля 2016 г. под эгидой IEEE.
- Центр НТИ больших данных в НГУ.
Разработки лаборатории:
- видеорезюме;
- идентификация дикторов;
- распознавание документов государственного образца (Павловский Е.Н., Луппов Д.А., Зырянов А.О., Алямкин С.А. Модуль анализа графической и видеоинформации: классификатор бланков документов. // Свидетельство о государственной регистрации программы для ЭВМ № 2017612227 от 17.02.2017.);
- разрешение кореференции;
- классификатор новостных сводок (Павловский Е.Н., Масловский И.А., Батура Т.В., Дюбанов В.В. Модуль анализа текстовой информации: классификатор текстов. // Свидетельство о государственной регистрации программы для ЭВМ № 2017611829 от 09.02.2017.);
- сбор досье из открытых источников.
Оборудование лаборатории:
- NVIDIA DIGITS сервер глубинного обучения ( процессор: 1×CPU Intel® Xeon® E5-2699v3 45Mb Cache 18C/36T / 2.30Ghz; сопроцессор: 4х12Гбайт NVIDIA GeForce TITAN X; оперативная память: 128Гбайт (16×8) 2133 МГц ECC REG);
- 2 рабочие станции для обучения нейросетей (процессор: 1×CPU Intel Core i7 6700K (4C, 3.4GHz, 2400MHz, 8MB, 140W) или 1×CPU Intel Xeon E5-1630 v3 (4C, 3.7GHz, 3.8GHz Turbo, 10MB, 140W) ; сопроцессор: 12 Гбайт NVIDIA GeForce TITAN X; оперативная память: 32 Гбайт (2×16) 2133 МГц ECC REG);
- 2 рабочие станции для работы с сетевым трафиком (процессор: 1×CPU Intel Xeon E5-1620 v4 (4C, 3.5GHz, 3.8GHz Turbo, 2400MHz, 10MB, 140W); сопроцессор: 8 Гбайт NVIDIA Quadro M4000; оперативная память: 32 Гбайт (4×8) 2133 МГц ECC REG; сетевой адаптер: 40GbE.Mellanox ConnectX-4 Lx EN);
- сервер для хранения данных (процессор: 1×CPU Intel® Xeon® E5-2620v2 15Mb Cache 6C/12T / 2.10Ghz; хранение: 2х2Тбайт SATA3 Caviar Green 64Mb; оперативная память: 32 Гбайт (16×2) 2133 МГц ECC REG;);
- сервер для обработки сетевых данных (двухпроцессорная система: 2×CPU Intel® Xeon® E5-2698v4 50Mb Cache 20C/40T / 2.20Ghz; сопроцессор: 12Гбайт NVIDIA Tesla K40; оперативная память: 128Гбайт (16×8) 2133 МГц ECC REG; сетевые адаптеры 80GbE: 2×40 GbE Mellanox InnovaFlex-4 Lx (with programmable FPGA); сетевой акселератор: 40GbE (4×10GbE) Napatech NAC NT-40-E3-4-PTP ).
Партнёры лаборатории:
- Институт математики им. С. Л. Соболева СО РАН
- Институт систем информатики им. А. П. Ершова СО РАН
- Лаборатория алгоритмики ММФ НГУ
- Лаборатория прикладной вероятности ММФ НГУ
- ФГБУ "Федеральный центр нейрохирургии" Минздрава России (г. Новосибирск)
- ООО "Тауконсалт" ("Movavi")
2017
2016
Участие сотрудников в конференциях:
Выступления:
- S.A. Alyamkin, N.A. Nikolenko, E.N. Pavlovskiy, V.V. Dyubanov. FRiS-censoring of reference sample in face recognition task by deep neural networks // Data Science and Engineering (SSDSE), 2017 Siberian Symposium on. IEEE. — 2017
- G. R. Khazankin, S. Komarov, D. Kovalev, A. Barsegyan and A. Likhachev. System architecture for deep packet inspection in high-speed networks, 2017 Siberian Symposium on Data Science and Engineering (SSDSE), Novosibirsk, 2017, pp. 27-32. doi: 10.1109/SSDSE.2017.8071958
- Павловский Е. Н., Пакулич Д. В., Поспелов С. О. Восстановление 3D-модели дефекта черепа на основе глубоких нейронных сетей // Вестник Новосибирского государственного университета. Серия: Информационные технологии. – 2017. – Т. 15. – №. 3. – С. 74-78.
- Kozlova A., Gureenkova O., Svischev A., Batura T. A. Hybrid approach for anaphora resolution in the Russian language // IEEE, Proceedings of 2017 Siberian Symposium on Data Science and Engineering (SSDSE). 2017. Novosibirsk, 12–13 April, 2017. P. 36–40. ISBN 978-1-5386-1592-8
- Gureenkova O. A., Batura T. V., Kozlova A. A., Svischev A. N. Complex approach towards algorithm learning for anaphora resolution in Russian language // Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue-2017”. V. 1. Iss. 16. 2017. pp. 89–97. ISSN 2221-7932
- Батура Т. В. Методы автоматической классификации текстов // Программные продукты и системы. Тверь: ЗАО НИИ ЦПС, 2017. Т. 30. № 1. C. 85-99. DOI: 10.15827/0236-235X.030.1.085- 099.
- Соколов А.В., Батура Т. В. Разработка системы разрешения анафоры на основе методов машинного обучения // Программные продукты и системы. Тверь: ЗАО НИИ ЦПС, 2017. Т. 30. № 3. С. 461–468. DOI: 10.15827/0236-235X.030.3.461-468.
2016
- Крутиков Н.О., Подаков Н.Г., Жилякова В.А. Разработка системы извлечения информации из текстов на русском языке в области криминалистики // Проблемы информатики. -- 2016, № 3. С. 70-84.
- Kulikov, V.A. Algorithm of tracking of intersecting objects based on a sequence of depth images (2016) Optoelectronics, Instrumentation and Data Processing, 52 (1), pp. 37-42.
- Батура Т.В. Математическая лингвистика и автоматическая обработка текстов: учеб. пособие / Новосибирский государственный университет. Новосибирск: РИЦ НГУ, 2016. ISBN 978-5-4437-0548-4. 166 с.
Участие сотрудников в конференциях:
- Gureenkova O. A., Batura T. V., Kozlova A. A., Svischev A. N. Complex approach towards algorithm learning for anaphora resolution in Russian language // Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue-2017”. V. 1. Iss. 16. 2017. pp. 89–97. ISSN 2221-7932
- Моргачева А.И., Куликов В.А., Косых В.П. Разработка динамического алгоритма трекинга объектов по особым точкам // 26-я Международной конференции GraphiCon 2016, Труды конференции. ИФТИ, ННГАСУ, Нижний Новгород, 2016 с. 110-112
- Batura T.V., Murzin F.A., Sagnayeva S.K., Tazhibayeva S.Zh., Yerimbetova A.S., Bakiyeva A.M. Link Grammar Parser for Turkic Languages and algorithms for estimation the relevance of documents // 2016 IEEE 10th International Conference on Application of Information and Communication Technologies (AICT-2016). 12-14 October 2016, Baku, Azerbaijan. 2016. pp. 104-107.
- Pavlovskiy E.N. Big Data in biology and medicine // International Conference on the Mathematical Modeling and High-Performance Computing in Bioinformatics, Biomedicine and Biotechnology, MM&HPC-BBB-2016, Novosibirsk, 31 august 2016. Invited lecture.
- Pavlovskiy E.N. Big data analysis and applications // Russian-British Workshop on "Uncertainty Quantification in Inverse Modelling". 25-27 April 2016, Academgorodok, Technopark. Invited lecture.
- Кулакова А.А. Проектирование системы управления образовательным процессом с использованием смешанных технологий // МНСК-2016. Новосибирск. Диплом 3 степени.
- Павловский Е.Н. Как искусственный интеллект меняет исследовательский подход? // МНСК-2016, 17 апреля 2016, Новосибирск. Приглашённый доклад.
- Павловский Е.Н. Применение нейронных сетей для дифференциальных уравнений // Восьмая международная молодежная научная школа-конференция "Теория и численные методы решения обратных и некорректных задач". 1-7 сентября 2016, Новосибирск, ИВМиМГ. Пленарный доклад
Выступления:
- Выпуск новостей из Вести24 про опасность ИИ
- Выступление на TEDx
- Искусственный интеллект без опасности
- Научно-популярная лекция Искусственный интеллект - без опасности
- Целостный подход к преподаванию Аналитики больших данных
- Опыт кластерных и междисциплинарных проектов с искусственным интеллектом
- О выступлении на SMM Сибири 2016
- Машинное обучение: кто кого учит // Статья в блоге metkere
- О наборе на курсы в НГУ
- Пресс-релиз о выпуске специалистов Big Data в НГУ
- Об открытии лаборатории и первом проекте
Заведующий лабораторий — Тучинов Баир Николаевич, email: bairt@nsu.ru, раб. телефон: +7(383)363-43-33 доб. 5628, моб. телефон +7 923 174 48 85
Сотрудники:- Амелина Евгения Валерьевна к.ф.-м.н.
- Бондаренко Иван Юрьевич
- Гребенкин Даниил Витальевич
- Гроза Владимир Валерьевич PhD
- Иванишкин Дмитрий Сергеевич
- Носенко Дарья Игоревна
- Павловский Евгений Николаевич к.ф.-м.н.
- Паульс Алексей Евгеньевич
- Пнев Сергей Дмитриевич
- Рубцова Юлия Владимировна к.т.н.
- Сивасвами Акилеш
- Снегирева Екатерина Вячеславовна
- Толстокулаков Николай Юрьевич
Стажеры
- Кучуганова Светлана Евгеньевна
- Баушенко Марк Андреевич
- Ульченко Ангелина Николаевна
- Королев Алексей Романович
- Яшкин Андрей Валерьевич
- Бланксон Рафаэль Ерукаларедди
- Динеш Редди
Проходят научную и производственную практику:
- Пандей Кайвалия Ананд
- Легченко Антон
- Чакрабарти Аник
- Лыу Минь Шао Кхуэ
- Кочанов Максим
- Размахнина Анжелика
- Рябова Ольга
- Вернер Константин
- Каменев Владимир
- Родин Михаил
- Николаев Никита
- Донец Александр
- Мартиросян Сюзанна
- Руснак Александр
- Елисеев Даниил
- Абгарян Григор
- Свейлам Мохамед Нассер Хассан