Allegro Tech Talks #10 - Machine Learning

Hej, dzisiaj byłem na meetupie w siedzibie Allegro dotyczącym machine learningu, więc podzielę się notatkami i tym co w głowie zostało.

  • polecony został kurs http://www.fast.ai/ (forum kursu też jest na
    Disclosure! http://forums.fast.ai)
  • odradzają podejście akademickie w sensie uczenia się pól gradientowych, dziwnych operacji na macierzach, bo niewiele się z tego wyniesie
  • dobrą praktyką jest sprawdzanie, które kernele wygrywają na Kaggle https://www.kaggle.com/competitions
  • był delikatny hejt na TensorFlow https://www.tensorflow.org/ choć właśnie z tego korzystają w Allegro
  • dobrą praktyką jest wynajmowanie sobie chmur na minuty dla obliczeń na GPU, wiele algorytmów doskonale na nich działa, co wydatnie skraca czas obliczeń, a koszty są niewielkie
  • ogólna uwaga, że bardzo często użycie machine learningu jest overengineeringiem, jak można coś zrobić prościej, to zróbmy
  • jak wychodzi nam np. 99% trafności klasyfikacji, to prawdopodobnie coś jest nie tak (lwią część danych stanowi coś regularnego, oczywistego co zapomnieliśmy przefiltrować)
  • precision vs recall https://en.wikipedia.org/wiki/Precision_and_recall
  • Zbiory danych https://www.europeandataportal.eu/pl/homepage
  • Pojawiło się hasło którego nie znałem collaborative filtering
  • Luźno związane z ML - polecają pythonową bibliotekę BeautifulSoup http://beautiful-soup-4.readthedocs.io/en/latest/
4 Likes

Co krytykowali w TF?

Wydaje mi się, że to było dosyć opinionated - duża praca wejścia i mała intuicyjność TF.