Hej, dzisiaj byłem na meetupie w siedzibie Allegro dotyczącym machine learningu, więc podzielę się notatkami i tym co w głowie zostało.
- polecony został kurs http://www.fast.ai/ (forum kursu też jest na
Disclosure! http://forums.fast.ai) - odradzają podejście akademickie w sensie uczenia się pól gradientowych, dziwnych operacji na macierzach, bo niewiele się z tego wyniesie
- dobrą praktyką jest sprawdzanie, które kernele wygrywają na Kaggle https://www.kaggle.com/competitions
- był delikatny hejt na
TensorFlow
https://www.tensorflow.org/ choć właśnie z tego korzystają w Allegro - dobrą praktyką jest wynajmowanie sobie chmur na minuty dla obliczeń na GPU, wiele algorytmów doskonale na nich działa, co wydatnie skraca czas obliczeń, a koszty są niewielkie
- ogólna uwaga, że bardzo często użycie machine learningu jest overengineeringiem, jak można coś zrobić prościej, to zróbmy
- jak wychodzi nam np. 99% trafności klasyfikacji, to prawdopodobnie coś jest nie tak (lwią część danych stanowi coś regularnego, oczywistego co zapomnieliśmy przefiltrować)
-
precision
vsrecall
https://en.wikipedia.org/wiki/Precision_and_recall - Zbiory danych https://www.europeandataportal.eu/pl/homepage
- Pojawiło się hasło którego nie znałem
collaborative filtering
- Luźno związane z ML - polecają pythonową bibliotekę BeautifulSoup http://beautiful-soup-4.readthedocs.io/en/latest/