Výzkumník pro strojové učení (m/ž)
Ve výzkumu řešíme širokou škálu úloh pro Seznam vyhledávání z oblasti strojového učení, zejména zpracování webových stránek, obrazu, textu či uživatelského chování. Jelikož jsme zavedená firma se spoustou uživatelů, máme tak k dispozici velké množství různorodých dat, jejichž kvalitu zaručuje tým Bussiness Inteligence. Jako výzkum řešíme projekt od samého nápadu a formování zadání, přes přípravu dat a návrh hlavních metrik až po spolupráci na nasazení. Modely učíme na našich dedikovaných serverech s grafickými kartami pro větší výpočty. Udržování si přehledu v aktuálních trendech je nedílnou součástí naší práce, proto klademe velký důraz na vzdělávání ať už samostudiem nebo v pravidelných organizovaných reading groups. Výzkumníci mají možnost vycestovat na konferenci či přednášet na univerzitách.
Představení týmu
Náš tým pracuje na širokém spektru problémů týkající se zejména vyhledání na webu, které typicky řešíme pomocí state-of-the-art algoritmů strojového učení. Jedním z největších projektů našeho týmu bylo rozšíření tradičního termového hledání o vektorovou větev, ve které se dotaz a dokument neporovnávají pouze na základě lexikální shody, ale shody sémantické. K tomu využíváme velké jazykové modely trénované na našem GPU clusteru na datech anotovaných našimi anotátory. O našem přístupu se můžete dočíst na rootu, našem blogu, našem článku prezentovaném na konferenci IAAI, či přednášce na MLPrague. Kromě práce samotné se snažíme být prospěšní komunitě, o čemž, kromě samotných přednášek a článků, svědčí i vydání našeho jazykovéhomodelu Small-E-Czech a anotaných dat v datasetu DaReCzech. Aktuálně náš tým věnuje úsilí projektu Featured Snippets, kde je cílem nabízet uživatelům odpovědi na jejich otázky přímo ve výsledcích vyhledávání.
Základní předpoklady
- Umíte programovat v jazyce Python a navrhovat efektivní algoritmy
- Orientujete se v problematice strojového učení
- Ovládáte základy Linuxu
Součástí práce výzkumníka je
- Podílení se na formování zadání výzkumné úlohy a analýzy problému
- Příprava a analýza dat – Python, pandas, (Py)Spark
- Učení ML modelů – pracujeme se širokou škálou modelů od těch jednodušších jako je třeba logistická regrese (Vowpal Wabbit) přes rozhodovací lesy (XGBoost/CatBoost) až po hluboké neuronové sítě (TensorFlow/PyTorch)
- Aplikace state-of-the-art metod pro zpracování jazyka a obrazu
- Týmová spolupráce při řešení problému a tvorbě kódu – Git, code review
- Vyhodnocení navržených řešení, interpretace a prezentace výsledků
- Předávání modelů a kódu do produkce např. pomocí Docker containerů
Co nabízíme
- Zajímavou a rozmanitou práci, řešení netriviálních problémů
- Velká data, možnost anotací
- Vyrábíme prototypy pro řešení těžkých problémů,
- Dostáváme věci do produkce, přímý dopad na miliony uživatelů,
- Vlastní výkonné servery, dedikovaná výpočetní kapacita
- Sdílení znalostí a zkušeností napříč Seznamem
- Osobní rozvoj – vzdělávání, reading groups a konference (v případě zájmu i veřejné přednášky na univerzitách a akcích)
- Super kolektiv a neformální a přátelské prostředí – všichni si tady tykáme a nemáme předepsaný dress code
- Možnost HO (až 3 dny v týdnu)
Na jakých produktech se budete podílet

Vyhledávání
S kým budete spolupracovat

Jakub Náplava
V Seznamu vedu jeden z fulltextových výzkumných týmů. Mám za sebou doktorát na ÚFALu a pětiletou zkušenost s vyvíjením machine learningových modelů v IBM. Velmi zde oceňuji široké spektrum zajímavých úloh, na které dostáváme dost času k zevrubnému zkoumání. Na naší práci je také super, že můžeme přicházet s vlastními problémy ke zkoumání, relativně krátký čas mezi natrénováním modelu a jeho reálným nasazením do produkce, ochota vedení publikovat náš výzkum ven, vlastní GPU cluster, in-house anotátoři schopní oanotovat vlastní data v relativně krátkém čase a v neposlední řadě i skvělý kolektiv. Po práci s týmem rádi hráváme stolní fotbálek a deskovky.
Zalíbila se vám tato pozice? Napište Kateřině

Podobné nabídky
-
Administrátor/ka
LinuxPythonVhodné i pro OZPVhodné pro muže i ženyVhodné pro: OZP, muže i ženy.LinuxPythonBrno, Praha -
C# Programátor
C++GitJavaScriptReactREST APIVhodné i pro absolventyVhodné i pro OZPVhodné pro muže i ženyVhodné pro: absolventy, OZP, muže i ženy.C++GitJavaScriptReactREST APIBrno, Praha -
Storage infrastructure egineer
DockerGitLabGrafanaKubernetesLinuxOpenStackPrometheusVhodné i pro OZPVhodné pro muže i ženyVhodné pro: OZP, muže i ženy.DockerGitLabGrafanaKubernetesLinuxOpenStackPrometheusPraha -
Vhodné i pro OZPVhodné pro muže i ženyVhodné pro: OZP, muže i ženy.ReactTypeScriptBrno, Praha
-
Infrastructure Engineer – Databáze
BashDockerGitLabGrafanaKubernetesLinuxMySQLPostgreSQLPrometheusVhodné i pro OZPVhodné pro muže i ženyVhodné pro: OZP, muže i ženy.BashDockerGitLabGrafanaKubernetesLinuxMySQLPostgreSQLPrometheusPraha
Praha – Anděl
Seznam.cz, a.s., Radlická 3294/10, Praha, Smíchov
Naši centrálu najdete hned u metra, tramvaje i autobusu. Přímo v budově pak můžete potrápit tělo v posilovně, zagrilovat si na některé z našich teras, kde máme i stolní fotbálky, nebo nakouknout pod pokličku Televize Seznam.
Máte jiné představy?
Podívejte se na ostatní volné pozice a vyberte si svou práci snů. Nebo nám rovnou pošlete svůj životopis. Podíváme se na něj a až se objeví místo pro vás, ozveme se.