Беларус придумал приложение, которое поможет лучше воспринимать тексты книг. И ищет CTO и инвестора
С появлением ребенка в семье возникла классная традиция — читать книгу перед сном. И вот, что мы с женой заметили: если книга содержит классные рисунки, малыш сосредоточенно слушает рассказ и быстрее понимает предложения и отдельные слова. Так и появилась идея проекта AllBook.
Кто пишет: Тарас Евич, маркетолог с 15+ годами опыта. Работал в Megatop, 7 Карат, А-100, Respect, Belbohemia, Kann. Сотрудничал с Lay’s, Purina. Владелец небольшого маркетингового аутсорса, а также основатель проекта AllBook.
Итак, о чем же AllBook?
Это приложение, которое позволяет детям лучше воспринимать тексты книг. В приложении будет несколько основных функций:
мгновенное создание картинок и иллюстраций;
создание аудиоверсий книги;
создание ваших собственных сказок и историй;
чтение по ролям с помощью ИИ.
Они будут реализованы с помощью разных нейросетей. Все они готовы предоставить свои мощности. Наш ближайший конкурент — NaturalReader. Это предложение преображает текст в голос на разные языки мира (более миллиона установок). Идентичного приложения пока, к счастью, нет.
Проектом заинтересовались в PocketBook
Как только меня посетила идея проект и придумался концепт, я сразу же сделал рендеры девайса в 3d. Подготовил презентацию для продажи. Проверил следующие гипотезы:
Интересно кому-то кроме меня?
Реализуемо?
Подготовил список всех известных нейронок, разделил их на сегменты и начал связываться. Одними из первых откликнулись ребята из leonardo.ai (австралийский проект ИИ для генерации графического и анимированного контента). Со мной на связь вышел их коммерческий директор.
Я презентовал ему проект. Его ответ — помимо возможности реализации задуманного функционала с ними, он готов рассмотреть покупку доли в проекте после выхода MVP.
Ещё я связался со всеми известными производителями электронных книг. Первыми на мой клич откликнулись ребята из PocketBook. Они готовы купить MVP и посоветовали выпустить мобильное приложение с таким функционалом, которое можно добавить в прошивку их книг.
Как будет зарабатывать проект
Модель монетизации будет комбинированная.
B2C — платная ежемесячная подписка.
бесплатная: работает только генерация изображений. Лимит — 10 изображений в неделю. Бесплатный период: 1 календарная неделя;
платная подписка «All»: доступна одна функция генерации. По ней неограниченное количество раз генерации в рамках календарного периода. Можно купить как помесячную, так и годовую;
платная подписка «All+». Доступны все функции без ограничений;
онлайн магазин книг от издательств и онлайн-маркетов книг.
B2B
можно презентоваць книги в мобильном приложении;
брендирование приложения.
В чём ценность проекта
Исследования показывают, что дети до показа иллюстраций воспроизводят текст в среднем на 25%, а после показа иллюстраций — 40-45%. Визуалы в книгах позволяет детям легче и быстрее строить ассоциативно-смысловые связи между звуком (чтение вслух), смыслом и изображением.
Когда ребенок начинает понимать смысл слов, которые слышит в процессе чтения, то истории, которые рассказывают родители, приобретают значение.
Появляется уникальная возможность познавать мир, находясь у себя в комнате. Не у каждой детской книги есть картинки, и точно не по каждой главе или сцене. Есть много классных молодых авторов, у которых нет денег на книгу с качественными иллюстрациями. Наш проект поможет «оживить» и такие книги.
Мы целимся не только на аудиторию родителей и их детей, но и на школьников, студентов, сценаристов, писателей. Всем, кому важно образное восприятие материала при его изучении или создании.
Возможность создать по рисунку текстовое произведение, в корне отличает нас от существующих игроков на рынке.
Ищу крутого технического специалиста
Я очень и очень ищу себе партнера — толкового CTO с успешными практическими кейсами, со знанием работы современных нейронок. И инвестора/соинвестора. Я отлично продаю, но у меня слабая техническая экспертиза.
Возможно вообще сработает теория 6 рукопожатий: кто-то прочтет и подскажет знакомому, который ищет для себя проект.
Однако я далек от ИТ-сферы и поэтому буду искренне рад любой помощи, консультации или участию. Верю, что AllBook будет востребованным и полезным.
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Искусственный интеллект уже стал повседневностью: голосовой помощник включает музыку, робот-пылесос сканирует пространство и убирает квартиру, алгоритм ранжирования настраивает ленту в TikTok, а беспилотные такси уже свободно курсируют по городам. Получить профессию в сфере ИИ с зарплатой от $100k в год тоже стало проще — собрали 5 интересных курсов от Udacity.
В DEIP из-за обвала курса от $1,1 млн осталось $350K, зарплаты не платят. CEO разбирает, как так вышло
Блокчейн-стартап DEIP больше двух месяцев не платит зарплату сотрудникам. Об этом dev.by рассказали несколько человек из компании: «официальная причина — стартап неправильно распорядился финансовыми ресурсами и денег нет. Подробностей не знаем». Сотрудникам сообщили, что топ-менеджмент ищет дополнительный капитал для погашения задолженности и дальнейшего развития. Но часть команды уже ищет новую работу.Мы также поговорили с СЕО DEIP Алексом Шкором — он рассказал, из-за чего у стартапа возникли сложности, как команда пыталась их решать и что собирается делать дальше. «Хочу поделиться опытом, чтобы на нём смогли научиться другие фаундеры, которые хотят идти в web3», — говорит Алекс. Ниже — подробный разбор.
Как только меня посетила идея проект и придумался концепт, я сразу же сделал рендеры девайса в 3d
А зачем девайс для чего-то, что полностью софтверное? Почему просто не сделать приложение на телефоны и планшеты?
Про генерацию картинок на лету. У меня есть приложение, которое делает что-то похожее для ресторанных меню. Сфотографировал и чатишься, можешь попросить визуализировать какие-то блюда. Результаты временами шокирующие. Иногда оно (OpenAI Vision) рисует вполне себе фотореалистичные и адекватные вещи. Иногда выдает абстракции, где пармезан парит на фоне галактик. Или доисторических людей, жарящих мамонта на вертеле. И почти никогда не может выдать нужное количество пальцев. Еще, очень трудно уговорить нейронку рисовать только блюда из меню и ничего больше. Но, возможно, если вы нанимаете компанию, специализирующуюся на генерации картинок, у них найдется что-то более надежное.
Как вы собираетесь решать проблему копирайта? Планируете договариваться с авторами книг?
Приветствую. Мы по сути сейчас и хотим сосредоточиться именно на софтине для мобильных. Девайс потом. Касательно багов при генерации картинок - Вы правы, мы именно и заручились поддержкой профильных нейронок в лице их руководства, чтобы не самим обучать с нуля, а воспользоваться наиболее толковыми и прокачанными решениями.
По проблемам копирайта: вопрос решен. Это также сила нашего бэкофиса: вопросов по авторству не будет, за исключением книг, выставленных на прродажу, через нашу аппку
Лол 1. "самим обучать с нуля" - это равносильно заявлению самим запускать спутники на орбиту. Сейчас с нуля никто уже ничего не обучает, толко если вы не условный OpenAI c тоннами бабла инвесторов. Без бабла стартапу "самим" можно обучить +- успешно только хотдог/не хотдог распознавать.
Лол 2. "заручились поддержкой профильных нейронок в лице их руководства" - а ну если заручились поддержкой прям руководства прям профильных нейронок, то конечно будет 100% гарантия качества инференса. Там по-другому и быть не может. А у всех остальных у кого пармезан парит на фоне галактик - там просто не заручились поддержкой профильных нейронок и их руководства. Так что бегом, заручаться :)
Лол 3. И про копирайт.. OpenAI/Microsoft бомбят все кому не лень за различные нарушение авторских прав тоже просто потому, что у них слабый бэкофис. Это же очевидно.
А так да, удачи. Идея конечно прикольная, но девайс 100% лишнее.
Згенераваць малюнкі па тэкставаму апісанню зараз не занадта цяжкая задача, а вось зрабіць іх кансістэнтнымі, каб, калі адзін персанаж які з'яўляецца ў главах 3-яй і 8-ай, то ён павінен выглядаць аднолькава - гэта цікавая задача.
Персонаж, окружение и весь контекст. Я боюсь представить размеры моделей и мощности чтобы держать «в уме» всю книгу для генерации каждому пользователем. Если автор это сделает - openai можно посыпать голову пеплом и закрываться.
Пользователь отредактировал комментарий 4 июля 2024, 14:30
Да вы как-то переусложняете. Да, было бы хорошо держать "в уме" всю книгу, но можно попробовать обойтись только небольшим куском. Остальное сложить в векторную базу и объяснить ЭйАй, как ей пользоваться. Он будет делать описание будущей картинки по текущему куску книги и ходить за деталями в базу. Это вполне может сработать. Генерилки картинок обычно разрешают загрузить одно или несколько изображений, чтобы брать их за основу. Можно грузить прошлые картинки или заранее сгенерить, например, основных персонажей. Это даст какую-то консистентность. В общем, можно пробовать и без команды ученых.
Ну, и там уже на подходе модели, создающие видео по тексту. Мне кажется, скоро мы увидим много подобных стартапов.
Не у каждой детской книги есть картинки, и точно не по каждой главе или сцене. Есть много классных молодых авторов, у которых нет денег на книгу с качественными иллюстрациями.
Это потому, что иллюстратор - не просто несколько мазков на тему абзаца, а сюжет сквозь всё произведение. Как уже отметили выше, современные нейронки очень далеки от этого. И ИМХО не будет на это способны ещё очень долго - это не нагенерить псевдонаучную лапшу на заданную тему.
А вообще сумбурно всё. Произведение по картинке, картинка по произведению... Это две разные совершенно задачи и целевые аудитории, кому это могло бы быть нужно совершенно разные. Зачем это лепить в одну кучу - не понятно.
Но в целом посыл у автора верный: побольше якорных слов типа нейронка и AI, сумбурных идей и инвесторы потянутся. Предлагаю расставить сети шире, не только ленивым писателям нужно делать текст по картинке, сейчас развелось много психологов, предложите инвесторам тему healthcare - это же будет чудесно, когда по наброску пациента сеть напишет рассказ на тему как детские травмы привели его в этот кабинет и будет генерирь ему мотивационные тексты по подписке.
идея трэшовая
платить за генерацию картинок уровня "как повезет" тоже весьма сомнительная затея
учитывая, какой трэш иногда генерят сеточки, "тестировать" это на своих детях - верх безумия
Проблемы, которые придется решить, они намного глобальнее чем сама прикладная задача. И задача эта перетягивает денежное одеяло на себя от иллюстраторов издателей полиграфистов и т.д. А если проблемы будут решены, то все они тоже будут использовать такое решение для упрощения своей работы, притом они ещё и доработают результат, чего ваша приложенька будет лишена. А вдруг она член для ребенка нагенерит там, такое не прокатит и будет караться как юридические так и репутационно.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
А зачем девайс для чего-то, что полностью софтверное? Почему просто не сделать приложение на телефоны и планшеты?
Про генерацию картинок на лету. У меня есть приложение, которое делает что-то похожее для ресторанных меню. Сфотографировал и чатишься, можешь попросить визуализировать какие-то блюда. Результаты временами шокирующие. Иногда оно (OpenAI Vision) рисует вполне себе фотореалистичные и адекватные вещи. Иногда выдает абстракции, где пармезан парит на фоне галактик. Или доисторических людей, жарящих мамонта на вертеле. И почти никогда не может выдать нужное количество пальцев. Еще, очень трудно уговорить нейронку рисовать только блюда из меню и ничего больше. Но, возможно, если вы нанимаете компанию, специализирующуюся на генерации картинок, у них найдется что-то более надежное.
Как вы собираетесь решать проблему копирайта? Планируете договариваться с авторами книг?
Приветствую. Мы по сути сейчас и хотим сосредоточиться именно на софтине для мобильных. Девайс потом. Касательно багов при генерации картинок - Вы правы, мы именно и заручились поддержкой профильных нейронок в лице их руководства, чтобы не самим обучать с нуля, а воспользоваться наиболее толковыми и прокачанными решениями.
По проблемам копирайта: вопрос решен. Это также сила нашего бэкофиса: вопросов по авторству не будет, за исключением книг, выставленных на прродажу, через нашу аппку
Сори, не смог удержаться.
Лол 1. "самим обучать с нуля" - это равносильно заявлению самим запускать спутники на орбиту. Сейчас с нуля никто уже ничего не обучает, толко если вы не условный OpenAI c тоннами бабла инвесторов. Без бабла стартапу "самим" можно обучить +- успешно только хотдог/не хотдог распознавать.
Лол 2. "заручились поддержкой профильных нейронок в лице их руководства" - а ну если заручились поддержкой прям руководства прям профильных нейронок, то конечно будет 100% гарантия качества инференса. Там по-другому и быть не может. А у всех остальных у кого пармезан парит на фоне галактик - там просто не заручились поддержкой профильных нейронок и их руководства. Так что бегом, заручаться :)
Лол 3. И про копирайт.. OpenAI/Microsoft бомбят все кому не лень за различные нарушение авторских прав тоже просто потому, что у них слабый бэкофис. Это же очевидно.
А так да, удачи. Идея конечно прикольная, но девайс 100% лишнее.
Згенераваць малюнкі па тэкставаму апісанню зараз не занадта цяжкая задача, а вось зрабіць іх кансістэнтнымі, каб, калі адзін персанаж які з'яўляецца ў главах 3-яй і 8-ай, то ён павінен выглядаць аднолькава - гэта цікавая задача.
Персонаж, окружение и весь контекст. Я боюсь представить размеры моделей и мощности чтобы держать «в уме» всю книгу для генерации каждому пользователем. Если автор это сделает - openai можно посыпать голову пеплом и закрываться.
Пользователь отредактировал комментарий 4 июля 2024, 14:30
Да вы как-то переусложняете. Да, было бы хорошо держать "в уме" всю книгу, но можно попробовать обойтись только небольшим куском. Остальное сложить в векторную базу и объяснить ЭйАй, как ей пользоваться. Он будет делать описание будущей картинки по текущему куску книги и ходить за деталями в базу. Это вполне может сработать. Генерилки картинок обычно разрешают загрузить одно или несколько изображений, чтобы брать их за основу. Можно грузить прошлые картинки или заранее сгенерить, например, основных персонажей. Это даст какую-то консистентность. В общем, можно пробовать и без команды ученых.
Ну, и там уже на подходе модели, создающие видео по тексту. Мне кажется, скоро мы увидим много подобных стартапов.
Это потому, что иллюстратор - не просто несколько мазков на тему абзаца, а сюжет сквозь всё произведение. Как уже отметили выше, современные нейронки очень далеки от этого. И ИМХО не будет на это способны ещё очень долго - это не нагенерить псевдонаучную лапшу на заданную тему.
А вообще сумбурно всё. Произведение по картинке, картинка по произведению... Это две разные совершенно задачи и целевые аудитории, кому это могло бы быть нужно совершенно разные. Зачем это лепить в одну кучу - не понятно.
Но в целом посыл у автора верный: побольше якорных слов типа нейронка и AI, сумбурных идей и инвесторы потянутся. Предлагаю расставить сети шире, не только ленивым писателям нужно делать текст по картинке, сейчас развелось много психологов, предложите инвесторам тему healthcare - это же будет чудесно, когда по наброску пациента сеть напишет рассказ на тему как детские травмы привели его в этот кабинет и будет генерирь ему мотивационные тексты по подписке.
идея трэшовая
платить за генерацию картинок уровня "как повезет" тоже весьма сомнительная затея
учитывая, какой трэш иногда генерят сеточки, "тестировать" это на своих детях - верх безумия
Проблемы, которые придется решить, они намного глобальнее чем сама прикладная задача. И задача эта перетягивает денежное одеяло на себя от иллюстраторов издателей полиграфистов и т.д. А если проблемы будут решены, то все они тоже будут использовать такое решение для упрощения своей работы, притом они ещё и доработают результат, чего ваша приложенька будет лишена. А вдруг она член для ребенка нагенерит там, такое не прокатит и будет караться как юридические так и репутационно.
В общем из пушки по воробьям