Subkrybuj na ulubionej platformie:
Rozmowa z Piotrem Rybakiem – NLP researcherem w PAN w Instytucie Podstaw Informatyki
Rozmawiamy min.:
– najlepszych praktykach w budowaniu systemów typu “Retrieval”
– jak trenować modele do tworzenia embeddingów
– o budowie datasetów, tłumaczeniu angielskich i scrapowaniu
– o tym czy LLMy mogą ukrywać przed nami swoją świadomość
– czy proste rzeczy są naprawdę proste i czy są łatwe do zrozumienia
– o różnicach w wiedzy na temat polskich i angielskich QnA
– modelach Silver Retriever,
– datasetach MAUPQA i POLQA
– aplikacji do rozpoznawania klocków LEGO
Przydatne linki:
Papers with code:
https://paperswithcode.com/search?q=author%3APiotr+Rybak
model Silver Retriever
https://huggingface.co/ipipan/silver-retriever-base-v1
datasety Polqa i Maupqa
https://huggingface.co/datasets/ipipan/polqa
https://huggingface.co/datasets/ipipan/maupqa
Aplikacja do rozpoznawania klocków LEGO:
https://brickognize.com/