Výskumník strojového učenia pre reprezentáciu užívateľov
Čo robíme
Základom mnohých systémov českej internetovej jednotky sú AI technológie. Tieto systémy sa nezaobídu bez modelov strojového učenia. Naše výskumné oddelenie sa stará o personalizáciu celého Seznamu, hlavne reklamného a doporučovacieho systému. Extrahujeme užitočné informácie z dát, ktoré potom poskytujeme ďalším našim službám. Naše modely hľadajú vzory v správaní používateľov, klasifikujú obsahy stránok, snažia sa pochopiť zámer vyhľadávacieho dotazu, modelujú časové rady, detekujú anomálie – a to je len malý výpis aplikácií, s ktorými sa výskum stretáva. Práca výskumníka však nie je len o učení modelov a ich vyhodnocovaní, ale aj o ich debugovaní, analýze dát, programovaní, navrhovaní efektívnych algoritmov, komunikácii s produktovými manažérmi a vývojom, ktorý sa stará o prevádzku modelov v produkcii. Neoddeliteľnou súčasťou je neustále vzdelávanie, štúdium odborných článkov a udržiavanie si prehľadu o trendoch, ktoré výskumník môže získať napríklad na špičkových zahraničných konferenciách.
Čo ťa čaká
Zameriaš sa na výzvy spojené s interpretáciou užívateľského správania vrátane časopriestorových dát. Budeš pracovať s dátami zo služieb ako Mapy, Sklik, Zboží, Seznam Zprávy, Novinky, Kupi a mnoho ďalších. Tieto dáta budú slúžiť ako vstup pre tvoje ML modely. Stretnúť sa možeš so všetkým, čo patrí do ML: rešerše SOTA, vymýšľanie úplne nových riešení, ladenie desiatok, spracovanie a analýza dát, modelovanie, vyhodnocovanie, debugovanie, AB testovanie, MLOps, týmová práca… To všetko medzi odborníkmi, ktorí majú za sebou desiatky úspešných (aj neúspešných) aplikácií ML na reálnych problémoch.
Aké technológie používame a ako fungujeme
- Základom je Python – Pandas, Numpy, Scikit-learn atď.
- V rámci spracovania GEO dát pracujeme s nástrojmi ako GeoPandas, MovingPandas, trackintel apod.
- Veľké dáta spracovávame v PySparku na Hadoop clusteroch.
- Na analýzy využívame nástroje Hive, Tableau a Jupyter notebooky.
- Modely učíme s pomocou TensorFlow, PyTorch, XGboost, Catboost, Vowpal wabbit apod.
- Pracujeme s jazykovými modelmi ako napríklad Small-E-Czech, využívame OpenAI API s ChatGPT a pracujeme aj na adopcii veľkých jazykových modelov.
- Všetko udržujeme pomocou GitLabu a jeho CI, Dockeru.
- S produktákmi si plánujeme svoju prácu a odbavujeme ju v dvojtýždenných sprintoch.
- Úzko spolupracujeme s vývojármi, ktorí vyvíjajú infraštruktúru a starajú sa o prevádzku produkčného prostredia.
Hľadáme niekoho
- Hľadáme niekoho, pre koho je Machine Learning vášeň a intenzívne sa mu venuje a aj naďalej chce.
- Má dobré znalosti v oblasti strojového učenia, dátovej analýzy a štatistiky.
- Má záujem o “časopriestorové” dáta – ich analýzu, spracovanie, interpretáciu alebo vizualizáciu.
- Vie, že optimalizácia modelu predstavuje len malú časť problému – nebojí sa kontrolovania a spracovávania dát.
- Má bakalárske alebo vyššie vzdelanie v oblasti strojového učenia alebo niekoľkoročné ( 3+) praktické skúsenosti s realizáciou projektov založených na strojovom učení.
- Vie slušne programovať v jazyku Python a navrhovať efektívne algoritmy.
- Spracovanie dát a dotazy v SQL mu nerobia problém.
- Spark je pre nás jedna z fundamentálnych technológií. Ak v ňom vie, bod navyše.
- Vie čítať dokumentáciu a odborné články v anglickom jazyku.
- Vie pracovať samostatne a aktívne komunikovať. Pracovať v tíme mu nerobí problémy.
Čo ponúkame
- Kreatívne a neformálne prostredie a možnosť sebarealizácie
- Budete sa podieľať na rozvoji systémov, ktoré denne využívajú tisícky inzerentov a ovplyvňujú obsah internetu pre milióny používateľov internetu
- Osobný rozvoj – vzdelávanie v rámci projektov, vyhradený čas pre vzdelávanie podľa vlastnej voľby, účasť na odborných konferenciách, prezentácie výskumu na interných a externých akciách
- Výber techniky (MacBook Pro, Dell) a prostredie (macOS, Windows, Linux), dobrý monitor
- Flexibilná pracovná doba
- Hybridné pracovné miesto – vyberieš si kedy pracuješ z domu (remote) a kedy v office
- Dlhodobá spolupráca
- Možnosť kvartálneho bonusu podľa plnenia cieľov
- 5 týždňov dovolenky bez ohľadu na vek
- Až 5 free days do roka
- Cafeteria
Zalíbila se vás tato pozice? Napište Tomášovi
Další volné pozice
-
ML trainee pro doporučovací systémy
JupyterPythonTensorFlowVhodné i pro OZPVhodné pro muže i ženyMožnost práce na zkrácený úvazekVhodné pro: OZP, muže i ženy, zkrácený úvazek.JupyterPythonTensorFlowPraha -
Machine learning výskumník pre E-commerce
LinuxPythonVhodné i pro OZPVhodné pro muže i ženyVhodné pro: OZP, muže i ženy.LinuxPythonBratislava -
Vedoucí týmu výzkumu pro e-commerce
PythonSparkVhodné i pro OZPVhodné pro muže i ženyVhodné pro: OZP, muže i ženy.PythonSparkPraha -
Výzkumník strojového učení pro e-commerce
PythonSparkVhodné i pro OZPVhodné pro muže i ženyVhodné pro: OZP, muže i ženy.PythonSparkPraha -
Datový analytik senior
ElasticsearchKibanaMySQLPythonVhodné i pro OZPVhodné pro muže i ženyVhodné pro: OZP, muže i ženy.ElasticsearchKibanaMySQLPythonPraha
Bratislava
Seznam.cz Slovensko, s.r.o., SKY PARK Offices, Bottova 7939/2A, Bratislava
Seznam.cz hľadá talenty aj na Slovensku. Naša bratislavská pobočka je prvou na Slovensku. Nové moderné priestory, špičkové zariadenie, kľud na prácu, zelená terasa s výhľadom a výborná dostupnosť dopravou, pešo aj na bicykli.
Máte jiné představy?
Pošlete nám rovnou svůj životopis. Podíváme se na něj a až se objeví místo pro vás, rádi se ozveme.