Data Science
前往频道在 Telegram
DS По всем вопросам- @haarrp @ai_machinelearning_big_data - machine learning @pythonl - Python @itchannels_telegram - 🔥 best it channels @ArtificialIntelligencedl - AI @pythonlbooks-📚 @programming_books_it -📚 Реестр РКН: https://clck.ru/3Fk3zS
显示更多41 319
订阅者
+1224 小时
+317 天
+37330 天
帖子存档
照片不可用在 Telegram 中显示
Запущен первый российский продуктовый бенчмарк RAG-решений: открыт прием заявок
Кейс, который важен всем, кто делает или внедряет корпоративные ИИ-решения: в России появился инструмент, позволяющий объективно сравнивать RAG-сервисы по реальным бизнес-задачам — RRNCB (Russian RAG Normative-Corporate Benchmark)
Что интересного внутри для AI/ML-команд:
🔹 Полный пайплайн: бенчмарк проверяет не только LLM, а все решение целиком — от извлечения документов до генерации ответа.
🔹 Реальные данные: тесты строятся на корпоративных сценариях — ГОСТы, договоры, регламенты.
🔹 Прозрачная методология: независимая оценка с участием экспертов и внешних LLM.
🔹 Прозрачная польза для всех участников: компании получают независимое подтверждение качества продукта и шанс попасть в первый рейтинг российских RAG-решений, а клиенты — рейтинг с понятными критериями.
К участию приглашены все российские компании, разрабатывающие и продающие собственные ИИ-продукты бизнесу. В рамках бенчмарка ожидается испытание популярных RAG решений: Сбер (GigaChat), Яндекс (Нейроэксперт), МТС (Cotype), Softline (Преферентум), Авито, Точка Банк, Just AI и других лидеров рынка.
🗓 Прием заявок на сайте RRNCB — до 21 ноября,
результаты — 12 декабря.
👉 Читать
照片不可用在 Telegram 中显示
Machine Learning Systems
Principles and Practices of Engineering Artificially Intelligent Systems
📚 Read
@datascienceiot
照片不可用在 Telegram 中显示
The Smol Training Playbook:
The Secrets to Building World-Class LLMs
📚 Read
@datascienceiot
照片不可用在 Telegram 中显示
🤖 От классифайда к собственному ИИ-ассистенту: кейс Авито
Технологическая платформа Авито регистрирует новый товарный знак для собственного ИИ-ассистента — «Ави», узнал Коммерсант. Его уже тестируют в разных категориях, чтобы в 2026 году запустить универсальное решение, которое будет работать во всех вертикалях.
Что внутри интересного:
🔹 «Ави» работает на базе большой языковой модели;
🔹 отвечает в формате живого диалога: уточняет цель покупки, важные параметры, рекомендует подходящие предложения и даже объясняет отличия между лотами.
«Коммерсант» пишет, что запуск подобных ИИ-решений крупными компаниями уже стал трендом на рынке. ИИ повышает отдачу и лояльность пользователей, позволяет собирать дополнительный контекст из общения с ассистентом и увеличивает вовлеченность в продукт, что положительно сказывается на продажах.
По оценкам экспертов, Авито уже мог вложить в разработку ИИ-ассистента около 500 млн руб. В уже озвученных планах компании были и еще более масштабные вложения: инвестировать 12 млрд в развитие генеративного ИИ и заработать более 21 млрд на технологии к 2028 году.
В открытом доступе уже есть две собственные ИИ-модели Авито — текстовая A-Vibe и мультимодальная A-Vision. Причем качество разработок подтверждают пользователи: A-Vibe всего за неделю набрала более 1400 скачиваний и вошла в топ трендовых моделей на платформе Hugging Face.
📚 Читать
@datascienceiot
照片不可用在 Telegram 中显示
GaussGym: An open-source real-to-sim framework for learning locomotion from pixels
Project: https://escontrela.me/gauss_gym/
Paper: https://arxiv.org/abs/2510.15352
Data: https://huggingface.co/collections/escontra/gauss-gym-datasets
Code: https://github.com/escontra/gauss_gym
@datascienceiot
🧠 От скалярного произведения к бустингу: RecSys кейс из Яндекс Лавки
Классный кейс для всех, кто пилит рекомендательные системы для реальных операционных задач. Команда Лавки рассказала, как они решали задачу мэтчинга курьеров и слотов рабочих смен.
Что внутри интересного для DS/ML-специалиста:
🔹 Бейзлайн: как стартовали с простого решения на векторах и скалярном произведении.
🔹 Feature Engineering: какие фичи собирают для ML-модели.
🔹 Выбор метрики: детальное объяснение, почему в их задаче Recall оказался важнее Precision.
🔹 Таргет: как теперь движутся от прокси-метрики «принял слот» к более честному таргету «вышел на слот».
Отличный разбор полного цикла — от эвристик до подготовки данных для полноценной ML-модели.
👉 Прочитать статью можно здесь
照片不可用在 Telegram 中显示
Does Model Size Matter? A Comparison of Small and LLMs for Requirements Classification
📚 Читать
@datascienceiot
照片不可用在 Telegram 中显示
Last Call: ИИ, бэкенд и фронтенд в одном хакатоне
Wink AI Challenge — соревнование для разработчиков, которые знакомы с нейросетями и мультимодальными данными. Разбираешься в NLP и интеграции моделей? Приходи и покажи, на что способен твой ИИ. Призовой фонд — 1 125 000 рублей.
Последние дни регистрации — открыта до 4 ноября включительно: https://cnrlink.com/winkaichallengeds
ML-инженеры, backend- и frontend-разработчики, DevOps, MLOps и мультимедиа-инженеры — ваш выход. Алгоритм такой:
1️⃣ Получи реальный текстовый набор данных.
2️⃣ Проанализируй структуру и извлеки ключевые сущности.
3️⃣ Собери ИИ-сервис, который помогает принимать решения в киноиндустрии.
Задачи хакатона:
🔸 Построй модель зависимости между сценами и структурируй сценарий.
🔸 Преврати текст в эскизы с помощью text-to-image для создания превизуализации сценария.
🔸 Создай решение, которое классифицирует контент и находит сцены, влияющие на возрастной рейтинг.
Финал пройдёт в Москве — двум участникам из команды Wink оплатит билеты и проживание. Успей зарегистрироваться на первый в России хакатон по применению ИИ в кинопроизводстве: https://cnrlink.com/winkaichallengeds
照片不可用在 Telegram 中显示
StarBench: A Turn-Based RPG Benchmark for Agentic Multimodal Decision-Making and Information Seeking
Read
@datascienceiot
A-Vibe и A-Vision — собственные языковые модели технологической платформы Авито — стали доступны всем.
Это первые российские решения, глубоко оптимизированные под русский язык и задачи e-commerce. Они подходят для анализа документации, создания ИИ-ассистентов и автоматизации контента. Компания потратила на разработку ИИ-моделей около полумиллиарда рублей.
Обе модели способны обрабатывать большие тексты (до 100 страниц) и вызывать внешние инструменты — например, для расчетов, поиска данных или работы с API. На их базе можно строить автономных ИИ-агентов и интегрировать технологии прямо в бизнес-процессы.
A-Vibe уже занимает верхние позиции в рейтингах, в том числе по пониманию русского языка. Команда Авито не собирается останавливаться: она адаптировала под русский целый набор тестов для оценки качества моделей. Все инструменты доступны бесплатно на Hugging Face.
照片不可用在 Telegram 中显示
Scaling Large MoE Models with Wide Expert Parallelism on NVL72 Rack Scale Systems
📚 Читать
@datascienceiot
照片不可用在 Telegram 中显示
Are Large Language Models Sensitive to the Motives Behind Communication?
📚 Читать
@datascienceiot
照片不可用在 Telegram 中显示
Новое техношоу о фейлах на дата-платформах
Все упало, все сломалось, бизнес в панике. Для дата-инженеров это обычный вторник, а для шоу «Дропнуто» — повод снять свежий выпуск.
«Дропнуто» превращает фейлы дата-платформ в истории, которые полезно услышать каждому, кто работает с данными. В центре каждого эпизода — один герой и одна яркая история фейла, развернутое обсуждение архитектуры и процессов, а также немного самоиронии.
Анонсы и ссылки на прямые эфиры появятся в телеграм-боте проекта.
Подписывайтесь, чтобы узнавать о премьерах первыми.
照片不可用在 Telegram 中显示
Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing
📚 Читать
@datascienceiot
00:12
视频不可用在 Telegram 中显示
МТС True Tech Champ — зрелищный шоу-чемпионат с ИИ-спецэффектами!
21 ноября МТС объединяет ИТ-конференцию и ИТ-чемпионат на одной площадке. Тебя ждет настоящий фестиваль технологий. Более 250 ИТ-талантов со всей России сразятся в лайв-кодинге и программировании роботов на скоростное прохождение лабиринтов со спецэффектами.
Между наблюдением за заездами и поединками ты сможешь:
▫️ послушать конференцию с международными спикерами в области ИИ;
▫️ поучаствовать в воркшопах и юмористических батлах в ИТ-качалке;
▫️ испытать себя в кодерских челленджах и других айтивностях;
▫️ перезагрузить карьеру в HR-Хабе вместе с командой МТС.
День завершится ярким афтепати со звездными хедлайнерами.
👉🏻 Участие бесплатно, количество мест ограничено. Успей зарегистрироваться
Видео.mp430.42 MB
