Pokaż model, dataset, metrykę i wynik biznesowy. ATS-clean, skanowalny dla rekrutera, i zbudowany dla lejka rekrutacji, który filtruje PyTorch, SQL i wdrożony model w produkcji.
Rekruterzy nie potrafią odróżnić poważnego data scientisty od hobbysty Kaggle w 8 sekund skanowania CV. Pomóż im: nazwij kontekst wdrożenia (inferencja w czasie rzeczywistym za usługą gRPC, scoring batchowy w Airflow), skalę danych treningowych i metrykę biznesową, którą model poruszył.
Umiejętności powinny dzielić się na 4 grupy: stack ML/DL (PyTorch, sklearn, XGBoost), data engineering (SQL, Spark, dbt, Snowflake), produkcja (FastAPI, MLflow, Sagemaker) i wizualizacja (Tableau, Looker, matplotlib). Nie wrzucaj wszystkiego do jednego bloku.
Publikacje i rangi Kaggle są warte po jednej linii każda na dole, nigdy lede. Lede to wdrożona praca.
Pomaga: jeśli jesteś na początku kariery lub w przejściu z badań. Czysty blok Projekty z 3 wdrożonymi modelami, każdy z datasetem, techniką i wynikiem, bije skąpą historię pracy.
Szkodzi: jeśli masz 5+ lat w przemyśle. Sekcja Projekty implikuje wtedy, że nie masz wystarczająco doświadczenia zawodowego, aby zapełnić stronę, co jest przeciwieństwem tego, czego chcesz.
Jeśli włączasz projekty, traktuj każdy jak pracę: linia ekwiwalentu firmy, daty, 2-3 kwantyfikowane punkty.
Odwrócona chronologiczna historia pracy z wynikami wdrożonych modeli, pogrupowana sekcja Umiejętności (ML, data engineering, produkcja, wizualizacja), Wykształcenie ze stopniem i tematem pracy magisterskiej, oraz Publikacje lub wyniki Kaggle tylko jeśli istotne.
Nie. Wymień frameworki (PyTorch, sklearn, XGBoost, Hugging Face), narzędzia, którymi budowałbyś systemy produkcyjne (MLflow, Sagemaker, Ray), i ekosystem (pandas, numpy). Pomiń każdą indywidualną bibliotekę wiz i każde mniejsze narzędzie do śledzenia eksperymentów.
Ranga grandmaster tak, w jednolinijkowcu blisko dołu. Kilka ukończonych tutoriali nie. Rekruterzy dyskontują Kaggle jako sygnał pierwotny, ponieważ dane są zbyt czyste, a metryka zbyt wąska.
Nazwij rozmiar datasetu, technikę, baseline i lift. 'Wytrenował klasyfikator XGBoost na 14M oznakowanych transakcji; podniósł recall oszustw z 71% do 84% przy tym samym budżecie fałszywych pozytywów' jest do obrony. 'Zbudował model state-of-the-art' nie.
Tak, w widocznym miejscu. Większość ofert data science filtruje SQL jako twardą wymaganą umiejętność i 30% kandydatów pomija go, ponieważ zakłada, że jest implicytny. Nie pomijaj go.
Bezpłatnie. PDF lub DOCX. Bez karty.
Sprawdź moje CV →