Больше информации будет доступно после регистрации
Lead Machine learning engineer/Senior Data scientist
320 000 руб.
- Занятость:Полная занятость
- График работы:Полный день
Опыт работы
Февраль 2019 —
январь 2021
январь 2021
1 год 11 месяцев
Сбербанк
Руководитель направления исследования данных
ЦА ПАО Сбербанк.
До 2020 главный ML engineer в продуктовой команде AI в текстах: чат-боты и голосовые помощники. Создание моделей машинного обучения в области NLP и интеграция с prod решением. Глубокое обучениеRNN, DSSM, Transformers модели в nlp. Сегментация текстов и тематическое моделирование, модели классификации текстов по сценариям. Выделение интентов и сентимент анализ, слотфиллинг. Проверка гипотез по изменению автоматизации, стат.тесты/бутстраппинг.
Первым в Сбербанке для чат бота СберОнлайн (сайт и приложение) запустил в продакшн нейронные сети, основанные на технологии deep learning (biLSTM with attention), реализация базового слот филлинга, достижение показателей по автоматизации. Лидирование junior специалистов.
С 2020, руководитель направления/senior deep learning engineer в Sber Devices, управление NLP платформ в голосе и тексте.
Отвечаю за natural language understanding (NLU) модели в проектах по голосовым ассистентам Сбер Салют(Афина,Джой,Сбер)
Реализации SoTa алгоритмов из статей arxiv: DistilBert, Sentence Bert, Electra etc, - цель улучшение понимания сообщений пользователя виртуальным помощником.
Первым в Сбербанке реализовал Sentence Bert для Русского языка на банковском домене.
Тестирование гипотез, валидация разметки, перспективные исследования.
До 2020 главный ML engineer в продуктовой команде AI в текстах: чат-боты и голосовые помощники. Создание моделей машинного обучения в области NLP и интеграция с prod решением. Глубокое обучениеRNN, DSSM, Transformers модели в nlp. Сегментация текстов и тематическое моделирование, модели классификации текстов по сценариям. Выделение интентов и сентимент анализ, слотфиллинг. Проверка гипотез по изменению автоматизации, стат.тесты/бутстраппинг.
Первым в Сбербанке для чат бота СберОнлайн (сайт и приложение) запустил в продакшн нейронные сети, основанные на технологии deep learning (biLSTM with attention), реализация базового слот филлинга, достижение показателей по автоматизации. Лидирование junior специалистов.
С 2020, руководитель направления/senior deep learning engineer в Sber Devices, управление NLP платформ в голосе и тексте.
Отвечаю за natural language understanding (NLU) модели в проектах по голосовым ассистентам Сбер Салют(Афина,Джой,Сбер)
Реализации SoTa алгоритмов из статей arxiv: DistilBert, Sentence Bert, Electra etc, - цель улучшение понимания сообщений пользователя виртуальным помощником.
Первым в Сбербанке реализовал Sentence Bert для Русского языка на банковском домене.
Тестирование гипотез, валидация разметки, перспективные исследования.
Ноябрь 2017 —
февраль 2019
февраль 2019
1 год 3 месяца
Центр анализа данных (ГБУ ИАЦ ДЗМ, Инфогород)
Аналитик/Data scientist
Центр анализа данных правительства г. Москвы (Big Data) группа машинного обучения (ИАЦ ДЗМ)
Машинное обучение, анализ данных, проектная работа. Ad-hoc задачи: аналитика в гос. секторе; фрод анализ/скоринг контрагентов; сегментация аудитории; проектная работа : модели таргетинга/перс.коммуникации для рассылок пользователям порталов mos.ru; анализ текстов: тональность обращений пользователей порталов mos.ru, тематическое моделирование/сегментация обращений, создание модели вопросно-ответной системы (чат-бот); задачи регрессии и классификации: миграция/отток; look-a-like модели, консалтинг, экспертиза в машинном обучении и анализе данных. Ведение проектов в качестве data scientist'а, постановка задач на выгрузки данных аналитикам.
Ведение проектов от постановки до пилота в управление городом на основе данных, в отраслях: ЖКХ, транспорт, услуги населению, образование, миграционная политика. Постановка и контроль задач для аналитиков и разметчиков. Презентация результатов.
Машинное обучение, анализ данных, проектная работа. Ad-hoc задачи: аналитика в гос. секторе; фрод анализ/скоринг контрагентов; сегментация аудитории; проектная работа : модели таргетинга/перс.коммуникации для рассылок пользователям порталов mos.ru; анализ текстов: тональность обращений пользователей порталов mos.ru, тематическое моделирование/сегментация обращений, создание модели вопросно-ответной системы (чат-бот); задачи регрессии и классификации: миграция/отток; look-a-like модели, консалтинг, экспертиза в машинном обучении и анализе данных. Ведение проектов в качестве data scientist'а, постановка задач на выгрузки данных аналитикам.
Ведение проектов от постановки до пилота в управление городом на основе данных, в отраслях: ЖКХ, транспорт, услуги населению, образование, миграционная политика. Постановка и контроль задач для аналитиков и разметчиков. Презентация результатов.
Май 2017 —
июль 2017
июль 2017
2 месяца
Raiffeisenbank
Аналитик (Junior Data scientist)
Анализ данных клиентского портфеля (CRM), машинное обучение, проектная работа: модели оттока клиентов по продуктам банка.
Ноябрь 2016 —
апрель 2017
апрель 2017
5 месяцев
SAP CIS (СНГ)
Data science Intern (стажировка)
Младший аналитик в presale команде отраслевой экспертизы в гос. Секторе. Анализ открытых данных, машинное обучение. Участие в проектах по предиктивной аналитике с примением продукта SAP predictive analytics (KXEN): скоринг контрагентов на выполнение контрактных обязательств, модели прогноза макроэкономич. показателей, выявление мест потенциальных проверок гос. органами.
Декабрь 2015 —
ноябрь 2016
ноябрь 2016
11 месяцев
Газпром информ, ООО
Инженер-технолог (младший аналитик)
Анализ существующих и разработка новых математических моделей транспорта газа (идентификация, оптимизация, прогнозирование) . Проектирование бизнес-процессов. Проектирование метамоделей. Составлении ТЗ, ЧТЗ: рисование схем взаимодействия модулей системы, интерфейсов (мокапов) системы для программистов. Ведение деловой переписки.
Обо мне
Ссылка на GIT:
-https://github.com/Ab1992ao
Опыт участия в соревнованиях по анализу данных:
Top 1% of the world, Kaggle Competitions Master, ссылка на профиль: https://www.kaggle.com/andrilko ;
Ссылки на проекты хакатонов:
-Хакатон "Tele2Hack": https://m.habr.com/post/420887/ , 1-е место, задача анализа диалогов центра поддержки абонентов
- Хакатон "Цифровой завод" ПАО Сибур, команда ML_witnesses: http://ai-community.com/otchet_sibur_hackathon поиск аномалий/прогноз поломок оборудования
- Хакатон в г.Иннополис, МТС, команда ML divers: https://m.vk.com/@ditmos-hakaton-v-kazani-prines-komande-dit-2-mesto прогноз ремонтов, 2-е место (секция Data science)
- Хакатон "Modulbank AI Hack MSK", команда overfitting_dummies: https://vk.com/wall-117459195_602, 2-е место next best offer модель
-Хакатон UrbanTechMoscow 2019 (1 место, трек "Искусственный интеллект" , поиск одежды по тексту и изображению). Реализовал модуль и чат бот по умному поиску одежды по текстовому описанию в составе команды LUC.
-Призер Всероссийского конкурса по анализу открытых данных РФ 2015 г команда AsuGubkin (3е место)
Проект: http://opendatacontest.ru/projects/khochupostupit_rf/
http://economy.gov.ru/minec/about/structure/dknrd/20151210
________________
Опыт преподавания курса по machine learning (38 ак.ч. +3 kaggle inclass соревнования) в ВУЗе и образовательном центре "Сириус" в г. Сочи. (2 смены: умный город, большие данные)
Статьи в области мат. оптимизации и анализа данных:
- Создание NLU моделей русского языка с BERT: https://m.habr.com/ru/company/sberdevices/blog/527576/, https://youtu.be/W3ko2fWWSQI
-Методы роевого интеллекта для задачи оптимального размещения скважин по кустам (NP problem solving) : https://elibrary.ru/item.asp?id=27252684
-Алгоритмы решения задачи краткосрочного прогнозирования газопотребления:
https://elibrary.ru/item.asp?id=24992312
Упоминания в других статьях:
-Нестационарная модель в задаче управления газотранспортной системой: https://cyberleninka.ru/article/n/nestatsionarnaya-model-v-zadache-upravleniya-gazotransportnoy-sistemoy-krupnogo-promyshlennogo-uzla
________________
Выступления:
- Опыт создания SentenceBERT, лекция для DS cooбщества Sberloga+ODS: https://youtu.be/W3ko2fWWSQI
- Всероссийская конференция по мат. моделированию и ИТ (РАН) http://conf.nsc.ru/ym2014/ru/participationview/244864;jsessionid=1A48962C2CEE3070479C174D3D5D48FF
- Конференция молодых специалистов «Газпром информ»
https://asugubkin.ru/news/300.html
-https://github.com/Ab1992ao
Опыт участия в соревнованиях по анализу данных:
Top 1% of the world, Kaggle Competitions Master, ссылка на профиль: https://www.kaggle.com/andrilko ;
Ссылки на проекты хакатонов:
-Хакатон "Tele2Hack": https://m.habr.com/post/420887/ , 1-е место, задача анализа диалогов центра поддержки абонентов
- Хакатон "Цифровой завод" ПАО Сибур, команда ML_witnesses: http://ai-community.com/otchet_sibur_hackathon поиск аномалий/прогноз поломок оборудования
- Хакатон в г.Иннополис, МТС, команда ML divers: https://m.vk.com/@ditmos-hakaton-v-kazani-prines-komande-dit-2-mesto прогноз ремонтов, 2-е место (секция Data science)
- Хакатон "Modulbank AI Hack MSK", команда overfitting_dummies: https://vk.com/wall-117459195_602, 2-е место next best offer модель
-Хакатон UrbanTechMoscow 2019 (1 место, трек "Искусственный интеллект" , поиск одежды по тексту и изображению). Реализовал модуль и чат бот по умному поиску одежды по текстовому описанию в составе команды LUC.
-Призер Всероссийского конкурса по анализу открытых данных РФ 2015 г команда AsuGubkin (3е место)
Проект: http://opendatacontest.ru/projects/khochupostupit_rf/
http://economy.gov.ru/minec/about/structure/dknrd/20151210
________________
Опыт преподавания курса по machine learning (38 ак.ч. +3 kaggle inclass соревнования) в ВУЗе и образовательном центре "Сириус" в г. Сочи. (2 смены: умный город, большие данные)
Статьи в области мат. оптимизации и анализа данных:
- Создание NLU моделей русского языка с BERT: https://m.habr.com/ru/company/sberdevices/blog/527576/, https://youtu.be/W3ko2fWWSQI
-Методы роевого интеллекта для задачи оптимального размещения скважин по кустам (NP problem solving) : https://elibrary.ru/item.asp?id=27252684
-Алгоритмы решения задачи краткосрочного прогнозирования газопотребления:
https://elibrary.ru/item.asp?id=24992312
Упоминания в других статьях:
-Нестационарная модель в задаче управления газотранспортной системой: https://cyberleninka.ru/article/n/nestatsionarnaya-model-v-zadache-upravleniya-gazotransportnoy-sistemoy-krupnogo-promyshlennogo-uzla
________________
Выступления:
- Опыт создания SentenceBERT, лекция для DS cooбщества Sberloga+ODS: https://youtu.be/W3ko2fWWSQI
- Всероссийская конференция по мат. моделированию и ИТ (РАН) http://conf.nsc.ru/ym2014/ru/participationview/244864;jsessionid=1A48962C2CEE3070479C174D3D5D48FF
- Конференция молодых специалистов «Газпром информ»
https://asugubkin.ru/news/300.html
Образование высшее
2016
Российский государственный университет нефти и газа (НИУ) им. И.М. Губкина, Москва
Факультет автоматики и вычислительной техники, Информатика и вычислительная техника (автоматизированные системы обработки информации и управления)
2014
Российский государственный университет (НИУ) нефти и газа им. И.М. Губкина, Москва
Автоматика и вычислительная техника, Автоматизированные системы управления
Знание языков
Русский — родной
Иностранные языки
Английский — A1 — Начальный
Гражданство, время в пути до работы
- Гражданство:Нет
- Разрешение на работу:Нет
- Желательное время в пути до работы:Не имеет значения