Хто такий спеціаліст з Natural Language Processing (NLP Specialist)? NLP Specialist є однією зі спеціалізацій Data Science, який займається обробкою природної мови: це можуть бути завдання розпізнавання мови, машинного перекладу, визначення емоційного забарвлення тексту і так далі. Фахівець з NLP може займатися переважно дослідницькою чи інженерною роботою - NLP Engineer та NLP Researcher.
NLP Researcher - це дослідник, який відповідає за грамотну роботу з даними та організацію коректних та відтворюваних експериментів. Такому фахівцю корисно мати глибокі знання з лінгвістики або працювати в тісній зв'язці з комп'ютерним лінгвістом.
NLP Research Engineer — розробник із добрими знаннями математики, алгоритмів, оптимізації, який може ефективно впроваджувати напрацювання дослідників та допомагати їм. Такому фахівцю достатньо мати базове уявлення про лінгвістику, семантику та лексику — розуміти природу даних, з якими працює. Кожен проект має свої етапи, які в процесі розробки можуть ітеративно повторюватися:
Від того, на якому етапі проект зазвичай залежить типовий робочий день NLP-фахівця. Наприклад, перший етап - пошук та читання статей. Часто на це йде не один день. Другий етап – дані. Дуже рідко, коли вони є, розмічені та у високій якості. На підготовку даних можуть піти місяці та величезний бюджет. Одночасно додаються завдання кодування: потрібно написати різні утиліти, які скрейпають дані з різних джерел, конвертують, рахують метрики, чистять код. Нарешті, третій етап – навчання моделі.
У зарплатному опитуванні на DOU немає даних про зарплати NLP-фахівців лише по Data Scientists без поділу на спеціалізації. Середня зарплата Data Scientist з досвідом роботи від трьох років – $3000, від чотирьох-п'яти років – майже $4000. Загалом у фахівця вузького профілю (CV чи NLP) зарплата буде в середньому вищою, ніж у General Data Scientist або General Machine Learning Engineer при схожому досвіді та освіті.
Переваги і недоліки. В основному фахівці обирають напрямок NLP, тому що їм це цікаво.Ця індустрія стрімко розвивається: постійно на слуху релізи нових NLP-моделей від Google, Facebook, Open AI, інтеграції різних моделей до опенсорсних бібліотек, досягнення Human Performance або нові state-of-the-art показники в NLP-завданнях. При цьому NLP настільки широка область, що її підходи знаходять себе в різних сферах.
Серед недоліків наголошується на розмитому розподілі обов'язків на проектах NLP та невеликій кількості вакансій як у світі, так і в Україні.Щодо кар'єрних перспектив, NLP-галузь постійно розвивається, тому зростання по горизонталі до нових технологій та завдань практично не обмежене.
Якщо вас цікавить NLP-галузь - вам до нас на Кафедру Системного аналізу!
Освітня програма підготовки бакалавра «Системний аналіз» дозволяє опанувати сучасні підходи до створення інформаційних систем, технології Big Data, Data Science, Business Іntelligence та інші. В межах освітньої програми вивчаються мови програмування Java, C++, C#, Python, а також проектування сучасних баз даних та знань з різною архітектурою SQL, MySQL. Увага приділяється вивченню таких дисциплін як:
Більш детальну інформацію можна отримати у завідувача кафедри Гордієнко Тетяни Богданівни (097)177-57-43 (viber, telegram)