Skip Navigation
Сколько стоит перевести Reddit на все языки, это выгодно?

Эта история у меня началась после того, как X внезапно начал переводить все на все языки. Я в какой то момент поймал себя на мысли: а сколько вообще стоит такая штука, если делать ее не кнопкой “перевести”, а на уровне всей платформы?

Не отдельные посты, не пользователь по нажатию, а именно весь поток. Появился пост или комментарий - сразу прогнали через модель, положили переводы в базу, проиндексировали, отдали пользователям и поисковикам.

На бумаге это выглядит очень мощно. Один и тот же контент сразу становится глобальным. Любой тред можно читать на своем языке, поисковики получают страницы под разные страны, вход в продукт становится шире. Но дальше возникает простой инженерный вопрос: сколько это стоит на самом деле?

Первая прикидка: берем H100 и большую модель

Сначала я пошел по самому очевидному пути. Берем мощную универсальную модель уровня DeepSeek и ставим ее на H100. Просто потому что это сейчас стандартный подход, когда хочется “максимально качественно”. Дальше прикинул поток постов на Reddit. В день появляется около 10 млн постов и комментариев. Средний кусок текста короткий, пусть около 75 токенов. В итоге выходит примерно 800 млн входных токенов в сутки. Если переводить на 10 языков, это превращается примерно в 8 млрд выходных токенов.

Когда начинаешь накладывать это на реальную производительность большой LLM, получается неприятный результат. Чтобы переварить такой поток, нужно около 1100 видеокарт уровня H100. Это уже не “сервер с GPU”, это полноценный дата центр.

По деньгам только видеокарты тянут примерно на 40 млн долларов, а с учетом серверов, сети, охлаждения и всего остального это становится еще больше. В этот момент становится понятно, что я вообще не туда пошел в размышлениях.

Вывод очевиден - меняем модель или видеокарты.

Если задача только перевод, зачем нам модель, которая умеет рассуждать, писать тексты и симулировать диалог? Погуглил и нашел, что есть специализированные модели ИИ для перевода. Например, NLLB. Она обучена именно на переводе, работает быстрее и дешевле.

И тут экономика резко меняется. Такая модель спокойно запускается не на H100, а на гораздо более обычных картах:

RTX 4090, L40S, A10, A100.

Оптимально под продакшен выглядит L40S. Это нормальная серверная карта, не космос по цене и при этом дает хороший throughput. После пересчета получается, что вместо тысячи H100 нам нужен кластер примерно из 250 L40S. Это все еще большой масштаб. Но это уже не история уровня OpenAI. Это просто дорогая инфраструктура, которую можно посчитать и собрать.

Сколько это стоит?

Берем те же 250 L40S. Одна карта стоит примерно 7 тысяч долларов. Только GPU дают около 1.75 млн долларов затрат.

Но на практике карта не существует сама по себе. Нужны серверы, CPU, память, диски, сеть, стойки и питание. Обычно это примерно столько же сверху, но чуть чтуь дешевле. В итоге получаем примерно 2.5 млн долларов на весь кластер. Это грубая прикидка, но порядок понятен.

Теперь электричество. Одна L40S ест до 350 Вт. В сумме кластер с учетом всего остального выходит примерно на 180 кВт. За месяц это примерно 130 тысяч кВт⋅ч. Если считать по средней цене дата центра, получается около 25 тысяч евро в месяц. И здесь интересный момент: электричество не выглядит основной проблемой. Основные деньги уходят именно в закупку железа.

А нужно ли 10 языков?

На этом этапе мне стало очевидно, что главный драйвер стоимости - это количество языков. Каждый новый язык линейно увеличивает нагрузку. Но трафик при этом растет не линейно. Первые языки по количеству носителей дают огромный эффект, дальше идет убывающая отдача, переводить, например, на финский, где носителей буквально несколько миллионов, а уровень проникновения английского - 97% становится абсолютно не выгодно. . Поэтому я решил не брать 10 языков, а подумать, какие реально дают максимальный охват. Выбор был по количеству носителей, топ выглядит так:  Английский, Испанский, Португальский, Французский, Русский, Хинди и Индонезийский. Еще везде есть Немецкий, но я посмотрел, что охват не самый большой (120 млн), при этом уровень проникновения Английского в Германии очень высокий, а значит это можно точно не ставить в приоритет. Что это дает по охвату?

Если грубо посчитать всех говорящих на этих языках, включая тех, кто использует их как второй язык, получается довольно внушительная цифра. Английский около 1.4 млрд, хинди около 600 млн (да, не все в индии говорят на Хинди), испанский около 560 млн, французский около 300 млн, русский около 250 млн, португальский около 260 млн, индонезийский около 200 млн. Просто складывать эти цифры нельзя, потому что есть пересечения. Но если привести это к уникальному охвату, получается примерно 3.5 млрд человек. Это около 65% всего интернета.

Пересчет под 7 языков

Когда расчет перешел с  10 языков на 7, нагрузка упала примерно на треть. Соответственно, кластер тоже уменьшается. Вместо 250 карт получаем примерно 180 L40S.

По деньгам:

  • GPU около 1.25 млн долларов
  • полный кластер около 2 млн долларов

По электричеству:

  • примерно 90 тысяч кВт⋅ч в месяц
  • около 18 тысяч евро в месяц

То есть теряется небольшая часть потенциального охвата, но сильно экономим на инфраструктуре.

Выгодно ли это Reddit

В сухом остатке экономика выглядит довольно простой. Запуск такой системы обойдется примерно в 2 млн долларов, плюс около 0.5 млн в год на поддержку и электричество. Для компании масштаба Reddit это не те деньги, которые нельзя потратить, вопрос только в отдаче.

А отдача здесь в первую очередь в трафике. Перевод открывает доступ к поиску на локальных языках и снимает барьер входа для огромного числа пользователей. Даже если это даст всего несколько процентов роста, это уже превращается в десятки миллионов дополнительных просмотров и, как следствие, миллионы долларов рекламной выручки в год. При нормальной реализации это выглядит как инвестиция с кратным возвратом.

Поэтому я думаю, что мы увидим такой шаг от компании в очень близком будущем. 

Telegram
🔧 ИИ заменяет оценщиков: реальный кейс


🔧 ИИ заменяет оценщиков: реальный кейс

Пользователь Reddit создал инструмент для автоматизации оценки стоимости повреждённой электроники. Это может значительно ускорить процесс и снизить затраты для малого бизнеса, занимающегося ремонтом или перепродажей техники.

Инструмент использует алгоритмы ИИ для анализа состояния устройства и предоставляет оценку стоимости, что позволяет заменить или дополнить роль оценщика.

Используйте ИИ для автоматизации оценки и экономии ресурсов.

Инструмент анализирует фотографии повреждённой техники и сравнивает их с базой данных, чтобы определить стоимость ремонта или перепродажи. Это особенно полезно для компаний, работающих с большим объёмом техники, где скорость и точность оценки критичны.

→ Источник
Telegram
🤖 AI заменяет разработчиков: кейс с Reddit


🤖 AI заменяет разработчиков: кейс с Reddit

Пользователь Reddit поделился, как с помощью AI-агента создал веб-приложение, используя сообщения в Slack. Это пример, как AI может выполнять задачи, которые обычно требуют участия разработчиков.

AI-агент автоматически анализировал сообщения и генерировал код для приложения. Это позволяет малым предприятиям сократить затраты на разработку.

AI может значительно снизить затраты на разработку.

Методология проста: AI-агент обучен анализировать текстовые данные и преобразовывать их в код. Это может быть особенно полезно для стартапов и малых компаний в технологической сфере, где бюджеты на разработку ограничены. Применение AI в таких задачах освобождает ресурсы для других бизнес-процессов.

→ Источник
Telegram
🤖 С чего начать изучение Claude Code?
🤖 С чего начать изучение Claude Code?

1️⃣Официальные доки — и они есть на русском. Особый упор сделай на "Быстрый старт" и "Лучшие практики Claude Code" — это реально основа.

2️⃣Курс Claude Code для начинающих на 15 коротких лекций. Это следующий шаг после доков.

Когда освоишь базу, переходи к интересному — собственным автоматизациям.

3️⃣Продвинутые темы: Skills, PRD и Автоматизация.

⏺Skills: официальная документация от Anthropic, есть перевод на русский.

⏺PRD для Claude: гайд от ChatPRD объясняет, как структурировать документ, писать user stories и критерии приёмки. Плюс есть отдельный PRD Creation Skill.

Автоматизация для не-программистов: хороший гайд на Reddit про Claude Code для нетехнических пользователей. Там про управление знаниями, обработку заметок и другие задачи без кода.

4️⃣Для общего понимания — глубокий гайд по Claude Code и контекст-инжинирингу. Там про Workflow, CLAUDE.md, субагенты, экономию токенов. Больше теория, но полезно для понимания, как это всё работает изнутри.

5️⃣Для закрепления практикой — статья на Habr. Это перевод "The Shorthand Guide to Everything Claude Code", там конкретный воркфлоу автора, skills, hooks, MCP, subagents. К статье есть связанный репозиторий — можно сразу брать и использовать.

🤖 В эпоху AI
Telegram
На Уолл-стрит джунам отрезают провод от мыши 🤷‍♀️


На Уолл-стрит джунам отрезают провод от мыши 🤷‍♀️

На Reddit эту байку пересказывают годами, и в ней куда больше здравого смысла, чем кажется.
Бесконечно тянемся к мыши при работе. Тратим на это тонну рабочего времени - за год набегают сотни часов чистой рутины.
А если админ в запарке стянул мышь со стола. Что тогда, работу останавливать? 😁

В 2024-2025 Microsoft добавила в Excel 365 новые шорткаты и фичи. Кто предпочитает мышку, про них вряд ли знает.
Вот 10 комбинаций, которые закрывают большую часть ежедневных операций. От простых к свежим.

1️⃣ Alt+= - мгновенная автосумма

Выделяешь диапазон, жмёшь Alt+=, СУММ() вставляется сама. Работает и для строки, и для столбца, и для нескольких столбцов разом. На каждой сумме экономишь 5-10 секунд, за день набегает приличная экономия.

2️⃣ Ctrl+T - умная таблица за секунду

Превращает диапазон в таблицу с автофильтрами, чередующейся заливкой и именованными столбцами. Формулы в такой таблице сами распространяются на новые строки. В регулярной отчетности спасательный круг.

3️⃣ Ctrl+Shift+L - фильтры вкл/выкл

Нажал = включил автофильтр. Нажал ещё раз = выключил. Никаких заходов в меню «Данные».

4️⃣ F4 - двойной агент

Внутри формулы: переключает ссылку между $A$1, A1, $A1, A$1. Вне формулы: повторяет последнее действие. Залил ячейку цветом? F4 повторит заливку на следующей. Два режима, одна клавиша.

5️⃣ Ctrl+E - Flash Fill

Задаёшь 1-2 примера в соседнем столбце, жмёшь Ctrl+E. Excel сам распознаёт паттерн и заполняет весь столбец. Вытащить имя из ФИО, домен из email, поменять регистр - всё без единой формулы. Появился ещё в 2013-м, но до сих пор вызывает «вау» даже у опытных. Да и чего уж тут. Я сам на момент когда работал с Power Query не знал про все шорткаты.

6️⃣ Ctrl+; и Ctrl+Shift+; - дата и время

Ctrl+; вставляет сегодняшнюю дату. Ctrl+Shift+; - текущее время. Статически, без пересчёта. Вместо тысячи =СЕГОДНЯ().

7️⃣ Alt+H+O+I - автоподбор ширины столбцов

А это мой фаворит. Очень уж нравится когда ширина таблиц отшлифована до идеала. Вместо двойного клика по границе каждого столбца мышкой: выделяешь всё (Ctrl+A), жмёшь Alt → H → O → I. Все 20, 30, 50 столбцов подгоняются под содержимое разом.

8️⃣ Ctrl+` (обратный апостроф) - показать все формулы

Переключает весь лист между результатами и формулами. Для аудита - самое то. Уж точно лучше чем проверять формулы по одной через F2.

9️⃣ Ctrl+Shift+V - вставка только значений

Microsoft добавила в Excel 365 в августе 2024. Один из самых запрашиваемых шорткатов за всю историю Excel. Коли часто копируешь в таблицы данные извне без нее никуда.

1️⃣0️⃣ Alt+W+E+F - Focus Cell

Подсвечивает всю строку и столбец активной ячейки, аки линейка на экране. В широких таблицах на 30+ столбцов глаза больше не блуждают.

Всего десять штук, запомнишь на раз-два. А разницу в скорости почувствуешь ещё быстрее 💯

Если у вас не срабатывает один из этих шорткатов - скорее всего, у вас русская версия Excel.
Дело в том, что комбинации вроде Alt + W + E + F - это не глобальные хоткеи, а последовательные нажатия клавиш-подсказок (keytips) на ленте, и в локализованных версиях буквы отличаются. Чтобы узнать актуальные подсказки именно для вашей версии, просто зажмите клавишу Alt - над каждым элементом ленты появятся нужные буквы. Дальше нажимайте их по цепочке. Например, Focus Cell в русском Excel вызывается через Alt → О → Я1 → Ф.


Завтра закину постец про то как поставить свеженький Office без сомнительных активаторов 😎

Попробуй потыкать в работе. А сколько ты знал комбинаций до поста?


🔥 - знал почти все
👍 - половину знал, половину нет
🤔 - Ctrl+Shift+V и Focus Cell — это что вообще??

#excel

@data_dzen
Telegram
🤖 Reddit делает ставку на ИИ-поиск как на новый прорыв


На отчётности за четвертый квартал Reddit объявил о стратегическом фокусе на развитии поиска, основанного на искусственном интеллекте. Компания планирует объединить традиционный поиск с ИИ-технологиями, чтобы улучшить пользовательский опыт и релевантность результатов. Хотя эта функция пока не приносит дохода, руководство Reddit видит в ней "огромный рынок и возможность" для будущей монетизации и укрепления позиций платформы.

#Reddit #ИИПоиск #МонетизацияИИ