эйай ньюз
Ir al canal en Telegram
Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением. Ex-Staff Research Scientist в Meta Generative AI. Сейчас CEO&Founder AI стартапа в Швейцарии. Aвтор: @asanakoy PR: @ssnowysnow
Mostrar más84 337
Suscriptores
+4324 horas
+1317 días
+92930 días
Archivo de publicaciones
00:56
Video unavailableShow in Telegram
вышло.. GPT Image 1.5
Реализм сильно улучшили. Это заявка на конкуренцию с Nano Banana Pro.
Заявлено, что можель работает в 4x раза быстрее чем GPT-Image 1. Но это оказалсь не правдой.
Картинка на 1.5MP генерится 60-65 сек – против ~90 сек у GPT-Image 1. Ускрорение есть, но это все равноу супер медленно. Нана банана генерит в 2 раза быстрее.
На лидербордах GPT Image 1.5 пока нет. Думаю, что будет где-то между Nano Banan Pro и Nano Banan.
@ai_newz
OpenAI_Introducing_ChatGPT_Images_powered_by_our_flagship_new_image.mp411.67 MB
❤ 72🔥 33😁 20👍 18⚡ 3🦄 1
Photo unavailableShow in Telegram
Мог бы и по-лучше черипик выбрать. Желтый воротник под розовым как-то не очень.
@ai_newz
😁 77❤ 17🤯 8😍 1
🔥FLUX.2 [max]
Парни из BFL зарелизили свой самую мощную модель!
* Grounded generation — ищет в интернете актуальный контекст в реальном времени: результаты вчерашних матчей, текущую погоду, исторические события с точными деталями. Просто добавьте в запрос фразу «Search the internet» — и магия начнётся.
* До 10 референсных изображений. Продукты, персонажи и стили остаются консистентными.
На лидерборде lmarena.ai модель занимает 3 и 7 место:
🔹 #3 на Text-to-Image
🔹 #7 на Image Edit
А на лидерборде artificialanalysis.ai:
🔹 #2 Text-to-Image и на Image Edit
Доступна только по API (ссылка на fal), лоры тренить тоже нельзя.
Скидывайте свои тесты в комменты.
@ai_newz
Нейродайджест за неделю (#98)
LLM
- Ramanujan-1 — Стартап одного из авторов трансформера выпустил 8B-модель, тренированную на AMD/TPU. Неплоха на общих задачах, но сияет в агентском кодинге, где показывает феноменальные результаты для своих 8B.
- Devstral 2 — локальный вайбкодинг — Mistral реабилитировались за Large 3. Devstral Small 2 (24B) на уровне GLM 4.6 по кодингу и запускается локально. Вместе с моделями выпустили и Vibe CLI — своего конкурента Claude Code.
Прочее
- Уход Яна Лекуна из Meta — Один из крёстных отцов AI уходит, чтобы основать стартап по World Models. Пара моих мыслей, разбор причин и конец целой эпохи в FAIR.
Личное
- Ищу Executive Assistant в мой стартап GenPeach.ai
> Читать дайджест #97
#дайджест
@ai_newz
❤ 30👍 16🔥 6⚡ 2😁 1💯 1
Пара мыслей про уход Яна Лекуна из Meta
Вы уже наверное слышали, что мой друг Ян ЛеKун, один из крёстных отцов AI и Chief AI Scientist в Meta, объявил, что уходит мз компании после 12 лет, и доработает только до конца декабря.
As many of you have heard through rumors or recent media articles, I am planning to leave Meta after 12 years: 5 years as founding director of FAIR and 7 years as Chief AI Scientist. The impact of FAIR on the company, on the field of AI, on the tech community, and on the wider world has been spectacular. The creation of FAIR is my proudest non-technical accomplishment. I am creating a startup company to continue the Advanced Machine Intelligence research program (AMI) I have been pursuing over the last several years with colleagues at FAIR, at NYU, and beyond. The goal of the startup is to bring about the next big revolution in AI: systems that understand the physical world, have persistent memory, can reason, and can plan complex action sequences. I am extremely grateful to Mark Zuckerberg, Andrew Bosworth, Chris Cox, and Mike Schroepfer for their support of FAIR, and for their support of the AMI program over the last few years. Because of their continued interest and support, Meta will be a partner of the new company. As I envision it, AMI will have far-ranging applications in many sectors of the economy, some of which overlap with Meta’s commercial interests, but many of which do not. Pursuing the goal of AMI in an independent entity is a way to maximize its broad impact. I will give some more details about the new company when the time comes. In the meantime, I’m sticking around Meta until the end of the year.Официально, он уходит, чтобы основать свой стартап, где он будет строить World Models и продолжать свой давний крестовый поход против нынешнего тренда на LLM. По мнению Яна, настоящий интеллект — это не просто предсказание следующего слова. Моделям нужна настоящая связи с физическим миром, AI системы должны понимать физический мир, иметь постоянную память, уметь рассуждать и планировать сложные цепочки действий. Это и есть его концепция World Models. Простой пример: eсли бы у нас была "модель мира" (World Model), то мы могли бы научить системы уверенно предсказывать, что произойдёт дальше в физическом мире – например роборука заранее бы могла предсказать, что произойдет если столкнуть кружку со стола. Что-то подобное, кстати, пытается построить и Фей-Фей Ли в своём стартапе - но пока это на очень ранней стадии и ничего умного, кроме как генерации 3D пространств там нет. -- В последние месяцы в Meta наметился явный конфликт видений. С одной стороны — Марк, который загорелся идеей AGI и требует от команд быстрых продуктовых результатов в гонке с OpenAI. С другой — Ян, который критикует нынешние LLM и считает, что до настоящего AGI ещё очень далеко. На этом фоне Цукерберг купил продуктово-ориентированных лидера Александра Ванга, вместе с половиной Scalе AI, что только усилило расхождение. Да и это унизительно для ЛеКуна - репортить Алексу, которые мнение ЛеКуна ни во что не ставит. Я больше писал об этом здесь, где так же предсказал уход ЛеКуна. Meta, будет строить новые LLM, пытаясь догнать GPT, а ЛеКун, освободившись от корпоративного давления, займётся тем, во что верит сам. Это не просто уход топ-менеджера (а Ян и не был менеджером). Ян был талисманом FAIR, лицом которого всегда можно было светануть, чтобы показать насколько крутые люди работают над ресерчем в Мете – это была репутационнная история как минимум. Жаль что эта эпоха закончилась. Что ж, будем следать за тем что выдаст Ян ЛеКун в ближайшее время! @ai_newz
Привет! Принёс инсайт для петербуржцев – где искать местное ML‑комьюнити.
В 2014 году я окончил Школу анализа данных. Если не знаете, ШАД – это хардовая двухгодичная программа Яндекса по подготовке датасаентистов и ML-щиков. Учёба там мне много чего дала, так что рекомендую.
Недавно я узнал, что в Питере уже два года существует пространство ШАДа, доступное не только для студентов, но и всех, кто интересуется DS/ML. Вчера отмечали его двухлетие, на которое меня позвали как выпускника. Я не смог приехать лично, но передал пригласительный товарищу – интересно было посмотреть, чем сейчас живут ML‑щики в Питере.
На ивенте была программа: эксперт из облачных сервисов Яндекса читал лекцию о деплойменте AI‑систем в прод, руководитель ШАД Алексей Толстиков поднял вопрос разницы и преимуществ соревновательного и классического форматов обучения.
Но для меня самое главное в таких историях – это нетворкинг. Организаторы сделали несколько открытых дискуссий, а с самого входа предлагали поучаствовать в активности на знакомства. Как по мне, это очень крутая возможность для общения, обмена идеями. Так можно и команду собрать, и новый проект запустить.
@ai_newz
🔥 71😁 31❤ 24👍 13💔 5🦄 4🫡 1
Photo unavailableShow in Telegram
Devstral 2 — локальный вайбкодинг
После разочаровывающего релиза Mistral Large 3, компания показала что не всё потеряно. Devstral Small 2, при 24 миллиардах параметров, набирает 68.0 на SWE Bench Verified, что уровень GLM 4.6. Модельку, на минуточку, можно запускать локально. А полноценная Devstral 2 — почти на уровне лучших открытых моделей.
Кроме этого Mistral выпустили Vibe CLI, своего конкурента Claude Code/Codex. К сожалению работает только через API, к локальной модельке подключаться не позволяет.
Маленькая модель доступна по Apache 2.0, большая по кастомной лицензии. Первое время модели в API бесплатные.
Веса 24B
Веса 123B
Vibe CLI
@ai_newz
Обычно с дизайном мерча, который компании раздают на всех технических конфах, все довольно грустно. Исключения на моем опыте - это разве что раритетная шапка от Google, которую я взял на Neurips в 2016 и кепка "GPU poor" от fal.
Очень часто мерч выглядит по-детски либо кринжово. Не хватает классного технарьского шмота настолько, что мне даже пришлось задизайнить самому и напечатать для себя несколько футболок с ai приколами.
Недавно на глаза попался мерч от Cloud․ru в коллабе с дизайнером Глебом Костиным (см картинки) - выглядит довольно прикольно, и посвящен запуску новой платформы для работы с GenAI.
Кстати, накидайте в комменты примеров классного мерча, который вам нравится.
@ai_newz
Photo unavailableShow in Telegram
Привет, фаундеры в чате есть? Как вы искали себе Executive Assistant и как собеседовали? Буду благодарен советам.
Меня как CEO начала засасывать админ работа в нашем стартапе, и кажется пора найти человека, который смог бы меня разгрузить в этих делах.
Ниже последуюет сама вакансия - вдруг кто-то сможет пореферить идеального кандидата.
---
🚀 Executive Assistant (Remote, Europe — Preferably Poland)
Join GenPeach.ai, an early-stage European AI startup (ex-Meta founders, backed by investors from DeepMind, Microsoft AI, Meta & OpenAI).
We’re building next-gen generative AI models for realistic image & video creation — and we need an EA to keep our fast, technical team running smoothly.
You will:
• Manage CEO calendar, inbox & comms
• Coordinate travel, meetings & logistics
• Support hiring, onboarding & people ops
• Handle docs, contracts & knowledge management
• Assist with investor updates & research
• Help run operations, tools & automations
We offer:
• Competitive salary
• Path to Chief of Staff
• Flexible hours, fully remote (EU time)
• Work with elite AI team
• Rapid learning & real impact
• Team meetings/offsites across Europe
Requirements:
• English B2+/ C1 (strong written & verbal communication).
• Excellent organization, time management, and attention to detail.
• Comfortable working in a fast-paced, changing startup environment.
• Proactive, independent, and reliable — able to anticipate needs.
• Tech-savvy; quick to learn tools like Airtable, Jira, Slack, Zapier/Make.
• Bonus: Experience as an EA or in operations at a startup/tech company.
🔗 More info: link
📩 Apply: artsiom@genpeach.ai (please send an email with the tag “[EA job application]” in the subject)
@ai_newz
Photo unavailableShow in Telegram
Ramanujan-1 — совсем без Nvidia
Стартап Essential AI, основанный Ashish Vaswani, тем самым что [Vaswani et al., 2017], выпустил свою первую модель. Тренировали эту 8B модель на смеси AMD MI300x и Google TPU v5p, при этом вся тренировка работает у них на Jax. Команда хвастается MFU в 50% на MI300x, правда речь, похоже, идёт о bf16.
На претрейн и инстракт бенчах модель выдаёт результаты сопоставимые с Qwen 3 8B, не смотря на то что на её тренировку было использовано в 4 раза меньше компьюта. Но по настоящему она сияет в агентском кодинге — на SWE-bench Verified Ramanujan-1 выдаёт феноменальные для такого размера 20,8. Другие модели в этой весовой категории выдают околонулевые результаты, поэтому их на таком сложном бенчмарке обычно не тестят.
Команда стартапа всего около 20 человек, так что релиз очень сфокусированный — модель выпустили всего в одном размере, на стоковой архитектуре Gemma, без ризонинг варианта и с крохотным контекстом в 32к. Но фундамент для будущих релизов заложен хороший, ждём пока ребята заскейлятся.
Веса
Блогпост
Демо
@ai_newz
Нейродайджест за неделю (#97)
LLM
- DeepSeek V3.2 и V3.2 Speciale — Новые модели, сравнимые с GPT-5 High. Speciale-версия берёт золото на олимпиадах по математике и информатике.
- Mistral Large 3 — Мультимодальная модель на архитектуре DeepSeek V3, но не SOTA даже в опенсорсе, зато мультимодальная. Вместе с ней вышли и новые Ministral.
- Opus 4.5 в Claude Code для Pro-подписчиков — Лучшая модель для кода теперь доступна и в подписке за $20.
Генеративные модели
- Runway Gen-4.5 — Тот самый Whisper Thunder. Новая видеомодель побила Veo 3 на арене ELO.
- Kling's Omni Launch Week — Разбор релизов: Kling Video O1, мощный видеоредактор. Image O1, Video 2.6 с генерацией аудио и Avatar 2.0.
Прочее
- 500+ промптов для Nano Banana Pro — Библиотека промптов для вдохновения.
Личное
- Включение из Стамбула — Репортаж с финала Yandex Cup, нетворкаю и ханчу ребят в GenPeach AI.
> Читать дайджест #96
#дайджест
@ai_newz
01:18
Video unavailableShow in Telegram
Kling's Omni Launch Week: разбираем все анонсы
Kling провели свою «Omni Launch Week», в ходе которой ежедневно выкатывали по фиче. Закос под OpenAI перед рождеством в прошлом году очевиден, но здесь релиз был довольно затянутым, тк фишек не так уж и много.
Гвоздём программы стала, конечно же, новая Kling Video O1.
Это их ответ Nano Banana Pro, но для видео. O1 — это видеомодель, которая работает с разными входами: текст, картинки (до 7 шт), видео (до 10 сек) и Elements.
Главная фишка — редактирование видео такое же свободное как в Runway Aleph. По бенчмаркам — полный развал конкурентов, но есть нюанс. Заявленный винрейт в 240% над VEO 3.1 (то есть Kling побеждает в 4 раза чаще) заставляет усомниться в методологии. Даже по черипикам видно, что модель может немного артефачить в деталях и демонстрирует не на столько хорошую физику по сравнению с Veo. Но вот редактирует она действительно мощно, а отставание в качестве не такое уж и большое. Тем более, что модель поддерживает до 10 секунд видео на вход, что в два раза больше, чем у Runway, и на пару секунд больше, чем у Veo. Хотя сравнивать с Veo не совсем честно, так как у него значительно более ограниченный функционал.
Стоимость: 12.8 кредитов за секунду (~$0.1 за секунду), что не много и не мало в современных реалиях.
Kling Image O1 — это уже чистой воды Nano Banana или FLUX.2. Модель понимает семантику и может генерить пейзажи по скриншоту Google Карт. На вход — до 10 картинок. Черипики неплохие, но сравнивать с Nano Banana Pro нужно на практике. Главный плюс — всё в одном интерфейсе. Из минусов — в отличие от Gemini, сюда нельзя закинуть файл с текстом (например, презентацию). Что странно, нет и чата.
Kling Video 2.6 — это уже отдельная модель, обновление их флагмана. Главное нововведение — поддержка аудиовыхода: генерирует всё, от диалог, звуковых эффектов до музыки и пения. По качеству видео это всё ещё не уровень Veo, о чём косвенно говорит и отсутствие бенчмарков для этой версии.
Прочее:
- Avatar 2.0: Ответ HeyGen и прочим. Генерирует говорящую голову с движением рук и тела. Главная фишка — длина видео до 5 минут.
- O1 Elements: Загружаешь картинку объекта, и сервис автоматически генерит «элемент» — набор изображений с разных сторон для лучшей консистентности + он работает как продвинутая референс картинка.
Здорово, что Kling позиционирует себя как инструмент для AI-продакшена и идёт в качество, а не в шаблоны, как это делают Higgsfield и другие агрегаторы. Sora здесь стоит особняком: её не назовёшь ни агрегатором, ни инструментом для топового AI-продакшена.
Главный релиз — это, конечно же, Kling Video O1 с его SOTA-уровнем редактирования. Остальные модельки не так прорывны и имеют аналоги получше. Но так как Kling Image O1 очень похожа на Nano Banana, хочется верить, что скоро Google порадует нас своей ответочкой для видео.
@ai_newz
Kling VIDEO O1 Model Officially Launched Input anything.mp49.85 MB
Прилетел в Стамбул, и сегодня я на финале Yandex Cup. Нет, я не сейчас не участвую, просто чилю и смотрю.
В треке по алгоритмам я сам участвовал когда-то 100 лет назад. А теперь тут есть еще трек и по ML, бекенду и фронтенду.
Если кто-то хочет подойти познакомиться - пишите. Кроме того мы сейчас в нашу Швейцарскую ресерч лабу GenPeach AI хайрим в том числе сильных бекенд и фронтенд инженеров (middle+). Так что пингуйте в лс.
@ai_newz
Opus 4.5 теперь доступен в Claude Code для пользователей Pro подписки
Лимиты выжирает быстрее, так что для всех задач использовать его не стоит. Поменять модель можно командой /model в Claude Code. Советую попробовать, это лучшая модель для кода на данный момент.
@ai_newz
Photo unavailableShow in Telegram
500+ промптов для Nano Banana Pro
Я не очень люблю копировать промпты из библиотек, но может кому-то они будут полезны хотя бы для вдохновения. Это набор промптов для Nano Banana Pro, юзкейсов которой можно придумать очень много.
Nano Banana Pro более разговорная, чем стандартный Flux, SD или Midjourney - то есть лучше промптить ее полноценными предложениями, как и видно из примеров.
> Сайт с промптами, там же сейчас можно и бесплатно погенерить с ней.
@ai_newz
🔥 89👍 35❤ 24😍 1🫡 1🦄 1
Mistral Large 3 — у нас есть DeepSeek дома
Архитектурно модель DeepSeek V3 с немного другим конфигом. Из преимуществ перед линейкой V3 — Mistral 3 мультимодальная, что редкость для открытых моделей такого размера (самое близкое что вспоминается — Qwen 3 VL). Ризонер варианта нет, базовая модель тягается на бенчах с Kimi K2 и DeepSeek V3.1.
Вместе с Large 3 компания выпустили новые Ministral — 14B, 8B и 3B. 14B лучше Qwen схожего размера, а вот 8B и 3B уступают Qwen 3 8B и 4B. Эти модели тоже умеют в мультимодальность и у них есть ризонинг варианты. Все четыре модели уже доступны по лицензии Apache 2.0.
Веса Large 3
Веса Ministral 3
Блогпост
@ai_newz
01:29
Video unavailableShow in Telegram
Mostrar todo...
whisperthunder.mp436.83 MB
❤ 116👍 59🔥 22⚡ 7❤🔥 4
