Ai molodca 🤖

Topik dari saluran:

Luma

Topik dari saluran:

Luma

Alamat saluran:

Kategori: Tidak terkategori

Bahasa: Bahasa Indonesia

Pelanggan: 21.13K

Deskripsi dari saluran

Кураторские AI генерации и полезности. Новый мир исследует @dobrokotov. Хаб: @AIMolodcaHub
«Al molodca - это канал в телеге, где какой-то чувак показывает картинки, которые делает компьютер» © Bing
На чай: QDpY9QQvijkOtyHFFVw3xyeHWr--zpjSc7qxW1OFb_dY0OU

▲ Pilih (1)

Ratings & Reviews

2.00

2 reviews

Reviews can be left only by registered users. All reviews are moderated by admins.

5 stars

4 stars

3 stars

2 stars

1 stars

Pesan-pesan terbaru 2

2024-05-13 20:33:30 – Показали GPT4-4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах.

– GPT4-4o это «Омнимодель» натренированная сразу на тексте, фото и видео — то есть та самая мультимодальность которую мы ждали.

– GPT4-4o уже доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее.

– Показали улучшенную версию аудио-чата через ассистента — она теперь шутит, понимает ваши эмоции; теперь ассистента можно перебивать своим голосом и сам ассистент говорит с эмоциями, и вы можете просить ее менять эти эмоции (даже петь). Переводчик с помощью GPT4-4o просто работает как в Sci-Fi кино (не путаясь и не требуя дополнительных нажатий кнопок).

– Запустят десктопные приложение наконец-то, чтобы не в вебе сидеть; в десктопном приложении ей можно показывать экран целиком и просить ее подправить код, что-то рассказать и тп. То есть это ассистент, который всегда видит ваш экран.

Дополнительные мелочи:

— Заявленные фичи выкатят через пару недель.
— Теперь через приложение можно просто ей показывать видео фид и она будет давать советы как решить какую-то задачу (не нужно фоткать ничего, работает как стрим);

— Во время демки ассистент тормозил хехе.

А вот что я предсказывал в посте выше и что сбылось или не сбылось:

Демку ассистента как из фильма Her
Полную мультимодальность: модель будет обучена сразу на видео, аудио, картинках и тексте
Размер контекстного окна в 1М (мы не знаем пока)
Новую архитектуру к новой модели, у которой сразу будут все фишки выше
GPT4 обновление с лучшим написанием кода, или 4.5 или 4.1 (с названиями, они, конечно, не консистентны)
Новую версию Dalle 3, с улучшенным фотореализмом

5.9K viewsDobrokotov, 17:33

Buka / Bagaimana

2024-05-13 20:33:30 Если вы пропустили, Денис уже накатал саммари презентации. От себя могу сказать, что: огонь, пушка, бомба. Жду возможность прикрутить голос Скарлет Йоханссон, чтобы полностью оказаться в фильме «Her» (усы у меня уже есть).

6.3K viewsDobrokotov, edited 17:33

Buka / Bagaimana

2024-05-13 20:15:33 Через 10 минут начнется презентация OpenAI — смотрим, чем Альтман будет удивлять. https://www.youtube.com/live/DQacCB9tDaw?si=rT4ow2ugBndRwm9G

6.4K viewsDobrokotov, edited 17:15

Buka / Bagaimana

2024-05-13 19:48:05 Через 10 минут начнется презентация OpenAI — смотрим, чем Альтман будет удивлять.
https://www.youtube.com/live/DQacCB9tDaw?si=rT4ow2ugBndRwm9G

5.3K viewsDobrokotov, 16:48

Buka / Bagaimana

2024-05-06 18:59:11 Немного контента про волшебную нейрошарманку #Suno.

1. Сделал GPT'шку для автоматической разметки текстов песен.

Указываете жанр и кидаете свой текст — получаете его обратно с проставленными [verse], [сhorus] и прочими важностями для модели. Если хотите больше контроля, то второй пункт:

2. Сделал шпаргалку по использованию метатэгов в текстах (на основе Suno WIKI):

База: текст песни важнее метатегов. Тэги лишь помогают модели, но не гарантируют результат. Структура текста, стиль и жанр влияют сильнее. Подбирайте метатеги по жанру!

Основная структура:

Куплет [Verse].
Припев [Chorus].

Дополнительные части песни:

[Pre-chorus] - промежуточная часть между куплетом и припевом.
[Bridge] - часть песни, отличающаяся от основной структуры, создает переход.

Другие части структуры:

[Intro] - тег не всегда работает, лучше описать как [instrumental intro].
[Hook] - повторяющаяся фраза или инструментальная часть.
[Break] - короткая пауза, где ведущие инструменты или вокал замолкают.
[Interlude] - инструментальная секция внутри песни.
[Outro] - завершающая часть песни, можно использовать теги [Fade out] или [Big Finish].

Инструментальные теги:

Можно использовать для создания инструментальных секций, например: [Instrumental Interlude], [Melodic Bass], [Percussion Break]. Важно учитывать жанр песни при использовании инструментальных тегов.

Голосовые теги:

Стиль вокала и пол исполнителя могут быть описаны в промпте стиля и жанра. Можно использовать стилевые вокальные теги, например: [Female Narrator], [Diva Solo], [Gospel Choir]. Но все очень зависит от жанра.

3. Выложил Шашлычок на Ютуб (кто-то просил в комментариях).

9.6K viewsDobrokotov, edited 15:59

Buka / Bagaimana

2024-05-01 23:01:50

Альбом каверов на MC Dimache — Шашлычок.

Я неиронично люблю творчество MC Dimache. Кто не знает — это школьник, который в 2008 напевал на диктофон песни и целые альбомы. Одна из них — культовая Шашлычок (обязательно послушайте). Люблю за то, что, помимо милой искренности и забавных текстов, это очень классная демонстрация того, что для реализации идей не обязательно пользоваться привычными инструментами и подходами. Этот альбом — трибьют этой идее и персонально мистеру Диманчу.

Сделано в Suno, визуал Dalle-3/Midjourney. Советую брать, как OST для IRL шашлыков (проверено на практике).

12.2K viewsDobrokotov, 20:01

Buka / Bagaimana

2024-04-27 12:55:01 О реальных возможностях SORA или разбор ролика Air Head

Сразу говорю, мини-фильм посмотреть все же стоит, потому что судить обо всем надо самому, а не по словам каких-то блоггеров в телеграме, нужно отслеживать и запоминать вехи. Да и ИИ-кино потихоньку все чаще становится высказываниями, а не просто тестами возможностей.

Невероятно люблю, когда громкость релизов разбивается о технические подробности после (а тут прямо сильно после) бета-тестирования.

Классный пост о статье Майка Сеймура у Сергея Цыпцына с техническими нюансами изготовления роликов на SORA (по-прежнему никакой магии). Интриг вокруг SORA все еще очень много, но уже понятно, что качество гоняется через Topaz, композиция правится через After Effects, в еще цензура, кругом одна цензура.

9.2K viewsDobrokotov, 09:55

Buka / Bagaimana

2024-04-24 18:43:37

Король и Шашлык.

Абсолютно проклято, но в главном конкуренте волшебных нейрогуслей Suno — Udio в датасетах полно русского рока. Который... можно генерировать. Пока что обнаружены: КиШ, ДДТ, Аквариум, Летов. Баг это или фича — непонятно, но думаю, что скоро шарманку прикроют.

А я попробовал создать песню абсолютно вымышленной группы Король и Шашлык. Про шашлык. Вот а тайм ту би алайв.

Промт на стиль (не думаю, что он оптимальный): Folk punk, horror punk, Король и Шут, КиШ, Korol & Shut, Михаил Горшенев Folk punk, Horror punk, Король и Шут, КиШ, Korol & Shut, Михаил Горшенев — подсмотрел у этого господина.

Ссылка на ютуб если кому нужно.

14.5K viewsDobrokotov, edited 15:43

Buka / Bagaimana

2024-04-24 12:45:38

Хотите учиться у экспертов в области IT? Школа анализа данных Яндекса принимает заявки до 12 мая, успейте зарегистрироваться.

ШАД для вас, если вы:

· интересуетесь Machine Learning
· имеете хорошую математическую подготовку
· уверенно владеете каким-либо языком программирования

Программа длится два года, обучение бесплатное. Можно выбрать одно из направлений: Data
Science, инфраструктура больших данных, разработка машинного обучения или анализ
данных и ИИ в прикладных науках.

Больше об учёбе в ШАД и возможностях для выпускников расскажем на днях открытых
дверей. Узнать даты и зарегистрироваться можно по ссылке.

11.4K viewsDobrokotov, 09:45

Buka / Bagaimana

2024-04-18 18:57:00 #ЧтоТоИнтересное

Понял, что я все же не новостной канал и еженедельно писать дайджест довольно трудно. Но держать вас в курсе важного хочется. Поэтому рубрика трансформируется из еженедельной в "когда-наберется-что-то-крутое".

Текст

GPT-4 снова в топе. После недавнего обновления, GPT-4 Turbo от OpenAI улучшил свои навыки в математике, коде и мышлении, побил Claude Opus и вернул себе первое место в рейтинге Chatbot Arena.

Открытые модели наступают. Command R+ от Cohere и Mistral-8x22B демонстрируют впечатляющие результаты, бросая вызов закрытым моделям. UPD: + новая ЛЛама!

Гуловский Gemini 1.5 с рекордным миллионом токенов на вход доступен и прекрасен. Почему о нем мало говорят — загадка. Видимо, надо сделать его платным? А пока только нужен VPN на Америку.

Яндекс запустил свой аналог Perplexity — Нейро — языковая модель + поиск. Ожидаемый шаг, поиск с AI под капотом — новый черный. Странно, что Гугл до сих пор не сделал.

ChatGPT против Юрия Лозы. Любопытное исследование показало, что ChatGPT может эффективно разубеждать людей, верящих в теории заговора, предоставляя им аргументированные опровержения.

Картинки

Вышел Stable Diffusion 3! Пока только в виде API. Выйдет ли в формате опен-сорса — загадка. Так как основной идеолог открытого кода — CEO Эмад был в начале года уволен. Я потестировал из коробки: "Ну окей", слабее Midjourney V6. Вся сила SD в его кастомизации, так что если не будет кода, кастомных моделей, то не очень понятно, зачем он нужен. Потыкать можно, например здесь.

Adobe представили аналог ControlNet для Firefly и целую студию GenStudio — рекламный центр для брендов с нейросеточками.

Российские сетки постепенно прокачиваются. Вышел Kandinsky 3.1 — мощнее, быстрее и реалистичнее. А YandexArt стал доступен по API. Обе попали в рейтинг визуальных моделей, Кандинский на 5 месте, Яндекс на 10. На первом — старый добрый Midjourney.

Фан-факт про Adobe Firefly. Оказалось, что "этический" Фаерфлай был частично обучен на картинках из Midjourney (которые пользователи массово загружали на адобовские стоки, которые и используются для обучения).

Видео

Adobe Premiere Pro с ИИ. Адоб, как всегда, берет самую мякотку и намазывает на привычные инструменты и процессы. Тут и добавление/удаление объектов с видео, возможность изменять продолжительность кадра, создавать динамичные отрывки по промптам. SORA и прочие навороты в комплекте.

Viggle анимирует всё. Пока все ждут SORA, вариантов с видео немного — пошевелить картинки в Gen-2 или стилизовать с помощью AnimateDiff. Viggle — свежий воздух, оживляет любые картинки и заменяет персонажей в видео с помощью промптов.

Midjourney идет в 3D и видео. На office hours ребята озвучили, что работают над новыми моделями для создания 3D, видео и симуляции всего мира. Это мы ждем.

Клип для группы Pain, созданный ребятами с @aifilmmaker. Классный пример соединения нейронок, привычных инструментов (вроде after effects) и художественного вкуса.

Аудио

Suno.ai разрывает инфополе после выхода третьей версии. Я уже давно использую, например для Слово Пиксара, но сейчас это стало массовой историей. Из последнего — запустили "Мою волну", по факту нейрорадио.

Udio, новый генератор музыки и песен, бросает Suno вызов. Может похвастаться более расширенными настройками. По качеству — примерно одинаково.

Общество

Энергопотребление ИИ растет. Аналитики Morgan Stanley прогнозируют, что к 2027 году генеративный ИИ будет потреблять столько же электроэнергии, сколько Испания.

AI Index Report 2024. Любопытный отчет от Стэнфорда о главных трендах в AI: рост затрат на обучение моделей, доминирование бигтеха в исследованиях, вопросы безопасности и этики, регулирование со стороны государств и многое другое.

Дипфейк-инфлюенсеры в Instagram. Meta борется с фейковыми аккаунтами, которые используют нейросети для создания реалистичных изображений. Мы уже такое разоблачили, но как я писал в своем тренд-репорте — тема будет набирать обороты.

14.0K viewsDobrokotov, edited 15:57

Buka / Bagaimana

Ai molodca 🤖

Postingan populer

Ratings & Reviews

Postingan populer

Pesan-pesan terbaru 2

Saluran Populer

Obrolan Terkait

Saluran Populer

Login