Стартап Human Archive привлекает 8,2 млн долларов на сбор данных для обучения роботов

Стартап Human Archive привлекает 8,2 млн долларов на сбор данных для обучения роботов

Рынок онлайн-доставки еды в Индии за последние несколько лет значительно вырос, о чем свидетельствует выход на биржу компаний Zomato и Swiggy, а также увеличение числа «облачных кухонь» – заведений, работающих только на доставку. Одновременно с этим набирают популярность стартапы, предлагающие бытовые услуги, такие как платформы для найма домашнего персонала по запросу, включая Urban Company, Snabbit и Pronto. Стартап Human Archive из Кремниевой долины использует этот тренд, сотрудничая с такими компаниями. Цель — собирать видеоданные от первого лица (эгоцентрические данные) о повседневных задачах с помощью специальных головных уборов с камерами, которые носят работники. Эти данные будут использоваться для обучения роботов.

Финансирование и основатели

Не называя конкретных партнёров, стартап заявил, что работает с компаниями из секторов бытовых услуг, хостелов и ресторанов для сбора эгоцентрических данных. В настоящее время развернуто более 1000 активных комплектов для сбора данных в различных местах. На волне этой активности Human Archive объявила во вторник о привлечении 8,2 миллиона долларов США инвестиций от Wing Venture Capital, NVP Capital, Y Combinator, а также от частных инвесторов из OpenAI, Nvidia, Google, Mercor, AfterQuery, BAIR, SAIL, Брэда Боа и Meta*.

Human Archive была основана четырьмя студентами из Беркли и Стэнфорда: Самаем Мани, Рушилом Агарвалом, Шлоке Пателем и Раджем Пателем (последние двое — двоюродные братья). Все четверо имеют опыт исследований в области робототехники, аппаратного обеспечения и тактильных данных.

Основание компании является прямой ставкой на направление развития индустрии искусственного интеллекта. По мере того, как робототехнические лаборатории и передовые ИИ-компании стремятся создавать машины, способные выполнять физические задачи в реальном мире, они сталкиваются с критическим препятствием — нехваткой высококачественных данных для обучения, показывающих выполнение человеком повседневной работы. Ставка Human Archive состоит в том, что работники активно развивающейся гиг-экономики Индии представляют собой неиспользованный и масштабируемый источник именно таких данных.

Отказы крупных игроков и публичная дискуссия

Хотя Human Archive работает с несколькими партнёрами, стартап сообщил, что многие индийские компании по предоставлению бытовых услуг, включая Pronto и Urban Company, отказали им в сотрудничестве.

Отказ крупных игроков стал предметом публичного обсуждения на прошлых выходных, когда индийское издание Entrackr сообщило, что Pronto активно ищет партнёрства для сбора данных о работниках в целях обучения робототехники, а Snabbit провела предварительные обсуждения с Human Archive, прежде чем проект развалился.

Генеральный директор Urban Company Абхирадж Сингх Бхал ответил в социальной сети X, заявив, что его компания не будет участвовать в подобных соглашениях. В ответ на это Пател парировал, что Urban Company вскоре будет вынуждена пересмотреть свою позицию, иначе рискует потерять актуальность из-за оттока клиентов. Соучредитель Рушил Агарвал высказался более резко, сообщив, что основательница Pronto Анджали Сардана негативно отреагировала на его предложение о партнёрстве по сбору данных, назвав идею «глупой». Pronto признала факт переговоров, но заявила, что решила не продолжать.

Технологический подход и ценность данных

По всей стране другие стартапы собирают эгоцентрические данные из различных рабочих сред, включая производственные цеха. Чтобы отличаться, Human Archive использует и разрабатывает дополнительные устройства, такие как тактильные перчатки, костюм для захвата движений всего тела и нательные камеры для запястий. Это позволяет синхронно фиксировать такие данные, как движение и тактильная сила, с RGB-D (цветное изображение, совмещённое в реальном времени с информацией о глубине), и продавать их лабораториям ИИ. Стартап полагает, что одних только видеоданных недостаточно, и их сочетание с данными других датчиков значительно повышает их ценность.

Радж Пател рассказал изданию TechCrunch, что при демонстрации проекта другим исследователям возникла идея совместить видеоданные с тактильными показателями силы. Основатели начали общаться с различными лабораториями и осознали растущий спрос на эгоцентрические и сенсорные данные, что привело к решению о создании компании в этой области.

Изначально Human Archive использовала самодельные установки или готовые решения для сбора данных. Теперь компания работает над собственным аппаратным обеспечением, которое совместно собирает различные виды данных. Уже развернуто более 50 различных устройств для сбора разнообразных данных.

По словам представителя компании, для сбора данных изначально использовались iPhone, затем были разработаны собственные установки и головные уборы. Сейчас Human Archive располагает более чем семью различными аппаратными продуктами, которые применяются для разных типов данных. После сбора информации из разных источников компания занимается её синхронизацией.

Компания заявила, что разрабатывает способы тонкой настройки моделей ИИ с использованием собственных данных и тестирования их на роботах для оценки эффективности выполнения задач. Таким образом, стартап может демонстрировать качество своих данных потенциальным клиентам и проводить пост-обучение внутренних моделей.

Зак Девитт, партнёр Wing VC, отметил, что стартап обладает уникальным преимуществом в сборе данных с нескольких датчиков.

«Никто другой в мире не смог синхронизировать и собирать в масштабе данные RGB-D с головной гарнитуры, обратную тактильную связь, полное отслеживание движений тела и синхронизированные данные с камер на груди и запястьях. Они проводят внутреннее обучение моделей на этих данных, и каждая крупная лаборатория и университет заинтересованы в проведении экспериментов с ними из-за новизны датчиков и масштаба нового набора данных, который они скоро выпустят», — заявил он TechCrunch.

Модель работы, конфиденциальность и планы на развитие

Несмотря на отказы от известных игроков в индустрии бытовых услуг, Human Archive объединилась с менее крупными стартапами, чтобы предлагать клиентам услуги по сниженным ценам. Когда работник прибывает домой, потребителям через приложение предлагается выбор: заплатить сниженную цену в обмен на согласие на сбор данных или заплатить полную стоимость за визит без записи.

Радж Пател отметил, что клиенты охотно выбирают первый вариант, поскольку споры о качестве услуг распространены, а видеозаписи могут помочь в их разрешении.

Компания платит работникам базовую ставку в 1 доллар США в час (около 90 рублей по текущему курсу) за участие в сборе эгоцентрических данных. Отчёт Economic Times указывает, что другие компании платят от 250 до 400 индийских рупий в час (что составляет приблизительно от 240 до 380 рублей или от 2,6 до 4,2 доллара США). Пател заявил, что конкуренты платят больше, чем Human Archive, но присутствие компании на месте в Индии позволяет ей удерживать компенсацию на более низком уровне.

Зак Девитт подчеркнул: «Сеть Human Archive предоставляет немедленные, гибкие возможности заработка по всему миру, снижая барьер для участия в экономике ИИ. Мы рассматриваем это как критически важный мост, который финансирует непосредственные средства к существованию, одновременно создавая инфраструктуру для более безопасного и продуктивного будущего».

Помимо оплаты труда, существуют проблемы конфиденциальности, связанные со сбором данных с помощью видеозаписи. Неясно, какую информацию Human Archive предоставляет работникам о том, как используются их кадры. Компания заявила, что её коммерческие контракты соответствуют Закону Индии о защите цифровых персональных данных (DPDP), поскольку она предоставляет уведомление о политике конфиденциальности, а также информацию о согласии, детализирующую цель сбора данных и методы их обработки. Компания заявила, что все данные анонимизируются, а лица размываются на записях. На прошлой неделе Moneycontrol сообщил, что Министерство электроники и информационных технологий Индии изучает механизмы согласия и методы сбора данных стартапов, собирающих эгоцентрические данные через работников сферы бытовых услуг.

Будущие перспективы

Хотя Human Archive в основном собирает данные в Индии, она начала расширяться в Юго-Восточную Азию и США. Компания также создаёт платформу для всех желающих участвовать в сборе данных и зарабатывать деньги. Она также хочет предлагать клиентам в США услуги, такие как уборка или приготовление пищи, в обмен на сбор данных участвующими работниками, хотя эти программы находятся лишь на ранней пилотной стадии.

Множество хорошо финансируемых стартапов соревнуются в создании физического искусственного интеллекта. Это требует огромных объёмов обучающих данных, показывающих людей в работе, и Human Archive является одним из игроков, конкурирующих за удовлетворение этого спроса. Масштабируемость её подхода будет зависеть от заключённых партнёрств, а также от уникальности и объёма данных, которые она сможет собрать, чтобы удовлетворить потребности лабораторий физического ИИ.

* — деятельность компании запрещена на территории РФ