video
presentation
summary
{transcript} AI mindset VI workshop 3 – 2025-02-04
{chat} AI mindset VI workshop 3 – 2025-02-04
General Information:
- Topic: AI-агенты, автоматизация, интеграции. Обзор моделей DeepSeek и O3-mini.
- Date: 2025-02-04
- Participants/Speakers: @Alex P, @Gleb K, участники лаборатории.
Summary
Третье занятие лаборатории AI Mindset VI было посвящено AI-агентам, автоматизации, интеграции инструментов и обзору новых моделей DeepSeek и O3-mini. Александр и Глеб рассказали о принципах работы с агентами, продемонстрировали разнообразные кейсы их применения и обсудили новые инструменты и подходы к автоматизации. В начале занятия участники поделились прогрессом в рамках дополнительных треков. Александр провел тренажер по медитации для развития внимания с использованием Lovable.dev. Были рассмотрены важные новости в мире AI, включая выход модели DeepSeek и её влияние на рынок.
Key Moments
- Прогресс в группах (Review & group work):
- Mik Wiseman (прототипирование): Провел мастер-класс по Cursor, запись доступна. Группа выбрала проект для спринта. В четверг планируется мастер-класс по одной из тем: ИИ-агенты, быстрое прототипирование с ИИ, инструменты для коллаборативной работы.
- Karina Arushtova (LinkedIn): Группа работает над бэкстори и стратегией позиционирования в LinkedIn.
- Даник Васильев (чат-боты): Продолжает разработку бота для AI Mindset и запись туториалов по no-code разработке ботов.
- Ваня Веллер (музыка): Анонсировал первую встречу музыкальной лаборатории — вводный урок по Ableton и обзор AI-инструментов для музыки.
- Федор Тараненко (ментальное здоровье): Разрабатывает чат-бота на базе Chatbase для знакомства с различными подходами в терапии.
- AI-агенты (Al agents):
- Что такое агент?: Агент — это автономный софт, который достигает поставленной цели, самостоятельно выбирая и используя необходимые инструменты. Отличие от ассистента: большая автономность и независимость от постоянных инструкций пользователя.
- OpenAI Operator: Демонстрация кейсов: бронирование ресторана, поиск товаров на Facebook Marketplace, автоматические комментарии и лайки в LinkedIn, заказ образцов у поставщиков, маркетинговые исследования и презентации, анализ товаров и цен. Риски и ограничения: доступен только в США и требует платной подписки, возможны ошибки и зависания, есть проблемы с безопасностью (может самостоятельно совершать платежи).
- OpenAI Deep Research: Агент для научных исследований и синтеза информации из множества онлайн-источников. Работает на модели O3. Доступен только в США и требует VPN в Европе. Показывает высокую эффективность, сравнимую с работой младшего научного сотрудника.
- Gemini Deep Research: Агент для онлайн-поиска и анализа информации, интегрируется с Google Docs.
- Автоматизация (automation):
- Инструменты: Zapier, Make (ex-Integromat), IFTTT, n8n (для связывания различных сервисов и приложений); Botpress, Voiceflow, FlowiseAI, Lindy.ai, Scade.pro, ManyChat, Taskade (для создания чат-ботов и ассистентов); Raycast, Harpa.ai, Max.ai (расширения для браузеров и других приложений).
- LLM в автоматизации: Интеграция LLM в сервисы автоматизации позволяет не только передавать данные между инструментами, но и интеллектуально их обрабатывать.
- Инструменты новой волны: Noodl, Taskade — платформы, специально разработанные для работы с LLM, позволяющие связывать различные модели, писать тексты и генерировать изображения.
- Кейс автоматизации: @Alex P продемонстрировал систему автоматического создания саммари для рабочих проектов, использующую Obsidian, Gemini и Lindy.ai.
- Интеграции и другие инструменты (integrations):
- Grok Research: Агент для поиска, анализа и агрегации информации из онлайн-источников, включая Twitter. Работает в реальном времени и хорошо справляется с актуальной информацией.
- Obsidian: Система для ведения заметок с локальным хранением и поддержкой Markdown и множества AI-плагинов.@Alex P продемонстрировал свой воркфлоу, включающий AI-чат и SuperWhisper.
- Perplexity: Поисковая система с AI, которая задаёт тренды в AI-поиске.
- ARC Browser: Браузер с встроенным AI, предлагающий новые способы взаимодействия с информацией (например, однокнопочный поиск).
- Windsurf: Инструмент для парного программирования с AI в терминале.
- Vo: Платформа для разработки веб-приложений с помощью AI. Позволяет генерировать код, UI-элементы и диаграммы прямо из чата.
- Lovable.dev: Платформа, позволяющая разрабатывать веб-приложения без кода с помощью AI. @Gleb K продемонстрировал создание интерактивной симуляции стаи птиц.
- Платформы для чат-ботов и ассистентов: Botpress, Voiceflow, FlowiseAI, Lindy.ai, Scade.pro, ManyChat, Taskade.
- Голосовые инструменты и API: OpenAI Advanced Voice API, Hume AI.
- ChatGPT с голосом: Встроенный голосовой интерфейс в ChatGPT (Advanced Mode).
- Самостоятельная работа: Участников призвали экспериментировать с AI-агентами, изучать другие AI-инструменты, делиться прогрессом и участвовать в коворкингах и офис-часах.
- Новости (Al news):
- DeepSeek R1: Новая открытая китайская модель, сопоставимая по качеству с ведущими моделями OpenAI, но значительно более дешевая в обучении. Доступна на платформе Groq и может быть установлена локально.
- O3-mini: Новая модель OpenAI, предназначенная для решения задач в области STEM. Доступна бесплатно.
- Обратная связь (sharing): Участники поделились впечатлениями и наметили планы.
- Медитация (slow Al): @Alex P провел тренажер по медитации, используя Lovable.dev, для развития концентрации и деконцентрации внимания.
Links (ссылки и описания)
- attention-wanderer.lovable.app: Интерактивный тренажер для развития внимания, созданный с помощью платформы Lovable.dev. Позволяет настраивать скорость, динамику и размер двух объектов на экране, а также паттерны их движения, для тренировки фокусировки зрения и распределения внимания.
- gptr.dev: GPT Researcher (GPR) — многоагентный исследовательский ассистент с возможностью специализации, позволяющий проводить глубокие исследования по заданной теме, от планирования до публикации. Использует LangGraph и требует API ключи от OpenAI и Tavily.
- www.snipd.com: Приложение для создания аудио-сниппетов из подкастов и аудиокниг с возможностью автоматической транскрипции и интеграцией с Obsidian. Позволяет сохранять ключевые моменты прослушивания и возвращаться к ним позже.
- x.com/i/grok?focus=1: Ссылка на Grok — новую LLM от xAI (Илона Маска), интегрированную в социальную сеть X (бывший Twitter). Отличительная особенность Grok — доступ к актуальной информации в реальном времени.
- feathered-flock-simulator.lovable.app: Демонстрационный проект, созданный на платформе Lovable.dev, представляющий собой интерактивную симуляцию стаи птиц. Позволяет настраивать различные параметры симуляции, такие как количество птиц, сила ветра и др.
- openai.com/index/introducing-deep-research/: Страница, посвященная агенту Deep Research от OpenAI. Этот агент использует "reasoning" для синтеза информации из онлайн-источников и выполнения многоступенчатых исследовательских задач.
- gemini.google.com: Gemini — семейство больших языковых моделей, разработанных Google. Gemini обладает широким спектром возможностей, включая генерацию текста, перевод, написание различных видов креативного контента и ответы на ваши вопросы информативным образом.
- platform.openai.com/playground/realtime: OpenAI Realtime Playground — интерактивная песочница для экспериментов с моделями OpenAI в реальном времени, включая возможность использования голосового ввода и вывода.
- github.com/openai/openai-realtime-api-beta: Репозиторий на GitHub, содержащий бета-версию API для работы с моделями OpenAI в реальном времени.
- www.hume.ai: Hume AI — платформа, предоставляющая фундаментальные голосовые AI-модели для различных интерфейсов. Позволяет создавать настраиваемые голосовые системы с использованием эмпатического AI.
- codeium.com/windsurf: Windsurf — инструмент от Codeium, который позволяет LLM запускать код на вашем компьютере для выполнения различных задач. Предоставляет возможность интерактивного взаимодействия с LLM через терминал.
- aider.chat: Aider - инструмент для парного программирования с AI в терминале. Позволяет генерировать и выполнять код, получать помощь в решении проблем и автоматизировать рутинные задачи разработки.
- app.crewai.com: Crew.ai — платформа для создания и управления многоагентными системами. Позволяет разрабатывать и внедрять автоматизированные workflows с использованием любых LLM и облачных платформ.
- vo.dev: Vo — платформа, которая позволяет разработчикам быстро создавать, тестировать и развёртывать голосовых агентов. Упрощает процесс разработки и внедрения голосовых интерфейсов.
- lovable.dev: Lovable.dev — платформа, предоставляющая услуги "сверхчеловеческого full-stack инженера" на базе AI. Помогает в разработке веб-приложений, автоматизации задач и генерации кода.
- www.liseller.com: Инструмент, автоматизирующий генерацию и публикацию комментариев в LinkedIn. Позволяет настраивать целевую аудиторию, темы и стиль комментариев.
- elevenlabs.io: Платформа для клонирования голоса и синтеза речи. Позволяет создавать реалистичные голосовые аватары и генерировать речь на разных языках.