Podcast

Spichlerz / Speakleash – open source dataset z polskimi tekstami – Sebastian Kondracki

Odcinek 67autor: photocoffeeman@gmail.com11 April 2023

Subkrybuj na ulubionej platformie:

Rozmowa z Sebastianem Kondrackim – jednym z założycieli projektu Spichlerz / Speakleash

Rozmawiamy na temat:
– czym jest projekt Spichlerz / speakleash
– ścieżce jaką przeszedł Sebastian poznając m.in ludzi z HuggingFace
– ilości danych potrzebnych, żeby trenować dobry model języka polskiego
– ochotnikach, którzy pracują przy projekcie
– etapie na jakim jest teraz projekt (update – ponad 140GB!)
– promowaniu polskich projektów Open Source
– osobach i organizacjach, które wspierają aktualnie Spichlerz

Szkolenie “AI dla programistów” – Codebooster.pl

PDF “Jak generować dane w chatGPT” (codebooster.pl)

Oficjalna strona
https://speakleash.org/

Repo na github:
https://github.com/speakleash

Dashboard pokazujący ilość danych:
Speakleash Dashboard · Streamlit

LinekdIn:
https://www.linkedin.com/company/speakleash/

Twitter
https://twitter.com/Speak_Leash

Discord
https://discord.gg/a2rz3v9e

Email
team@speakleash.org

PyPi
https://pypi.org/project/speakleash/

Linkedin Sebastiana:
Sebastian Kondracki | LinkedIn

Osoby zaangażowane w projekt:
Jacek Chwiła (Credit Agricole Bank Polska)
Adrian Gwoździej (BTC)
Ryszard Tuora
Jan Maria Kowalski(Bank Pekao SA)
Grzegorz Urbanowicz
Izabela Babis (Deviniti)
Mateusz Kuras (Deviniti)
Maciek Ogrodnik (Deviniti)
Maria Filipkowska, PhD
Tomasz Siedlecki
Marcin Kurzyna (Wirtualna Polska S.A.)
Waldemar Boszko
i inni anonimowi pasjonaci AI