norden.social is one of the many independent Mastodon servers you can use to participate in the fediverse.
Moin! Dies ist die Mastodon-Instanz für Nordlichter, Schnacker und alles dazwischen. Folge dem Leuchtturm.

Administered by:

Server stats:

3.5K
active users

#Anthropic

16 posts16 participants1 post today

🤖👨‍💻 Нове дослідження Microsoft #Research виявило, що навіть передові ШІ-моделі o1 від #OpenAI та Claude 3.7 Sonnet від #Anthropic здатні виправляти помилки в коді не більше ніж у половині випадків. Тестування проводилося на базі бенчмарку SWE-bench.

В ході експерименту ШІ-агенти намагалися вирішити 300 завдань, які стосувались налагодження коду. Лідером стала модель Claude 3.7 Sonnet, яка виконала завдання з успішністю на 48,4%, друге місце посіла OpenAI o1 (30,2%), третє – o3-mini (22,1%).

Kürzlich erschien in #t3n ein Artikel über die seltsamen "Denk"-Prozesse der #LLM's und wie wenig man davon weiß:

KI-Blackbox geknackt: Anthropic enthüllt, wie Claude wirklich denkt – und es ist bizarr
[t3n.de/news/ki-blackbox-anthro]

mit 2 Kernaussagen:
1
"Kaum eine Technik, die so breit eingesetzt wird, wurde jemals so wenig verstanden – wenn nicht sogar noch nie eine."

2
"LLMs sind seltsam und man sollte ihnen nicht trauen."

In #Midjourneyv7 sieht das so aus... 👀🤔😉

#anthropic
#genAI