Mentionsy
Better Dev Club #9 - Benchmarki AI, czyli wydajność vs. cena
Zapisz się na newsletter żeby zawsze być na bieżąco z nowościami: https://betterdevclub.pl/newsletter
🔗do 9 odcinka Better Dev Club Weekly:
GDPval-AA Leaderboard | Artificial AnalysisHumanity's Last ExamDwóch MS MVP:
Piotr Stapp
Kajetan Duszyński
zajmują się przeglądem nowości z zakresu szeroko pojętego AI, nowoczesnych narzędzi.
Szukaj w treści odcinka
A SWE Bench jest bardziej niezależny, z tego co wiem.
Także jak rozmawiamy sobie programista do programisty, to pewnie dla nas bardziej wartościowym jest SWE Bench.
Natomiast fajnie, że są, fajnie, że coraz więcej mówi się o takich benchmarkach i coraz bardziej zwracamy na to uwagę, to znaczy jak nieduże różnice są tak naprawdę pomiędzy tymi modelami, bo w przypadku SWE Bench różnica pomiędzy Clodem, Gemini a GPT jest naprawdę minimalna, a cena jednak robi swoje.
Ostatnie odcinki
-
Better Dev Club #33 - Pstryk i nie ma AI: co ma...
18.06.2026 07:00
-
Better Dev Club #32 - Wojna benchmarków, nowe m...
11.06.2026 07:00
-
Better Dev Club #31 - Junior w erze AI: bać się...
04.06.2026 07:00
-
Better Dev Club #30 - Google I/O na luzie. Gemi...
28.05.2026 07:00
-
Better Dev Club #29 - Trendy Gartnera. Czy nadc...
21.05.2026 07:00
-
Better Dev Club #28 - Koniec z 'git push i do d...
14.05.2026 07:00
-
Better Dev Club #27 - Z jakich narzędzi AI korz...
07.05.2026 07:00
-
Better Dev Club #26 - Z Andrzejem Krzywdą o DDD...
30.04.2026 07:00
-
Better Dev Club #25 - Koniec taniego AI. Opus 4...
23.04.2026 07:00
-
Better Dev Club #24 - Dlaczego warto chodzić na...
16.04.2026 07:00