contextrot

Культ HTMX + daisyUI

2026-04-08T00:00:00+00:00

После того как мы кратко познакомились с htmx и всё таки решили пойти в крестовый поход против javascript, vite, react, ангуляра и здравого смысла, пора задуматься какие же задачи мы можем решить с помощью htmx а какие - нет.

Htmx решает одну задачу: обновляет определенную часть интерфейса куском HTML который вернул сервер. Можно настраивать когда обновлять, что именно менять и как это встраивать в DOM, но суть именно такая. Сам по себе htmx никак не отвечает за стили и не диктует, как оформлять интерфейс. Этот вопрос я предлагаю закрывать через… daisyUI!

daisyUI - слой поверх tailwind который даёт готовые классы-компоненты. Честно, уважаемые читатели, я пробовал довольно много решений которые должны “просто работать”:

Вайбкодить весь сырой css без какой-либо библиотеки - оказалось что тут не всё так просто и задачки занимали ОЧЕНЬ много времени даже простые даже если как-то структурировать css. И много токенов уходило на “поддержку” этих стилей
Вайбкодить весь сырой css с помощью “очистителей” то есть чтото типа a-more-modern-css-reset - разницы с первым пунктом особо не заметил.
CSS first библиотеки а-ля “picocss”, решения в которых весь css написан за тебя то есть твой выглядит уже совсем не как дефолтный. У LLMок, по моему опыту, начинаются трудности поскольку бОльшая часть css находится вне проекта и, соответственно, вне контекста.
Tailwind CDN - честно, я практически переставал понимать десятки классов которые клод пихал в атрибуты… это тоже становилось довольно тяжело

Напомню что я преследовал оч конкретную цель - вайбкодинг фронта для:

админок
внутренних панелей
MVP

И вот тут я пришёл к daisyUI! Это заранее написанные и сгруппированные tailwind классы, на нашей стороне количество стилей ну МИНИМАЛЬНО. На актуальном daisyUI v5 это выглядит примерно так.

Чистый Tailwind:

 class="rounded-lg border border-gray-200 bg-white p-6 shadow-sm">
   class="text-xl font-semibold text-gray-900">Delete post
   class="mt-2 text-sm text-gray-500">
    This action is irreversible.
  
   class="mt-4 flex justify-end gap-2">
     class="inline-flex h-10 items-center justify-center rounded-md border border-gray-200 px-4 text-sm font-medium transition hover:bg-gray-100">
      Cancel
    
     class="inline-flex h-10 items-center justify-center rounded-md bg-red-600 px-4 text-sm font-medium text-white transition hover:opacity-90">
      Delete

daisyUI:

 class="card bg-base-100 shadow-sm border border-base-300">
   class="card-body">
     class="card-title">Delete post
    This action is irreversible.
     class="card-actions justify-end">
       class="btn">Cancel
       class="btn btn-error">Delete

Для моего юзкейса это важно не потому, что daisyUI какой-то “магический фреймворк красоты”, а потому что он снижает LOC и снижает шансы что LLMка случайно сгенерит свалку из десятков 27 utility-классов половину из которых потом забудет. Сами авторы daisyUI поддерживают актуальную LLM-first документацию где чё использовать!

Честно, даже не хочется расписывать особо технические плюсы минусы. Я не фронтендер и сам эти стили не читаю… Самое главное МНЕ что такое решение просто работает и позволяет не тратить большое кол-во токенов на поддержку этого чудища. Если замечаю что становится подозрительно много стилей промчу что-то вроде “изучи доку daisyUI и подумай не нарушаем ли мы базовые принципы”. Кода стилей становится существенно меньше)0))

Давайте поговорим про ощутимые минусы. Всё вот это “удобно, zero-build, кайф” очень отрезвляется ситуацией в которой кто-то заходит на сайтик и видит какую-то сломанную дичь… Почему? Потому что HTML у нас может приехать нормально с нашего сервера, а вот CSS едет отдельным запросом на внешний CDN.

Типичный zero-build кусок выглядит так:

  href="https://cdn.jsdelivr.net/npm/daisyui@5"
  rel="stylesheet"
  type="text/css"
/>

То есть страница открывается не одним монолитным “сайт загрузился”, а цепочкой:

браузер получает HTML
видит ссылку на внешний стайлщит
идет в другой домен за CSS
ждет пока тот ответит
только потом нормально красит интерфейс

И вот этот внешний CDN может тупить, быть временно недоступен. У пользователя может резаться доступ корпоративной сетью, адблоком, провайдером, чем угодно(( Причём с @tailwindcss/browser ситуация сложнее чем с обычным CSS: это не файл со стилями, а JS который сканирует DOM и генерирует CSS прямо браузере — значит даже при доступном CDN стили могут не применится если скрипт упал, не успел отработать до рендера, или ещё чего. Такое происходит(

В этот момент пользователь видит что кнопки расползлись, карточки исчезли, отступы умерли, интерфейс ВСЁ

Чисто технически можно попробовать:

Вшивать css себе в свой бэк т.е в свою static директорию.
- Плюсы: независимость от внешнего CDN, полный контроль над тем что и откуда грузится, LLMке проще работать с локальным файлом
- Минусы: начинаешь сам отвечать за доставку, кеширование и обновление этих стилей

Добавить немного JS который прячет body до загрузки CDN и показывает обратно по onload/onerror, плюс таймаут на случай зависания:

Плюсы: пользователь не видит сломанный интерфейс, только пустую страницу на момент загрузки
Минусы: если CDN совсем умер — 3 секунды белого экрана перед тем как таймаут сработает

Реально собирать css с помощью (условно) ноды отдельным процессом
- Получится уже не чистый zero-build, зато это самый взрослый вариант если проект ВДРУГ вырос

Я ничего этого не использовал потому что нет необходимости эти проблемы решать, я перезагружу страничку итд. Всё работает четко в 90% случаев ну и конкретно для моего юзкейса этого достаточно.

Обязательно попробую какие-то решения выше и отпишу… Вообщем, использовать htmx вместе с daisyUI это некая БАЗА из моего практического опыта

Баны Claude Code и CC Gateway

2026-04-01T00:00:00+00:00

У вас забанили аккаунт Claude Code? Известная проблема. Благодаря вчерашней утечке исходников удалось зареверсить внутрянку и понять механику телеметрии которая летит в Anthropic.

Что мы теперь знаем:

Claude Code собирает 640+ типов телеметрии по 3 параллельным каналам, снимает fingerprint вашей машины по 40+ параметрам и стучит домой каждые 5 секунд. Device ID, email, версия ОС, установленные рантаймы, тип шелла, архитектура CPU и объём RAM — всё это непрерывно улетает на серверы.

“Решение”: CC Gateway

https://github.com/motiful/cc-gateway

Умельцы сотворили reverse proxy, который встаёт между Claude Code и серверами Anthropic. Вся телеметрия проходит через него и нормализуется до единого «канонического» профиля.

Что именно подменяется:

— device_id, email, session metadata → единый канонический ID — весь env-объект (40+ полей: ОС, архитектура, Node.js, терминал, пакетные менеджеры, CI-флаги) → полностью свапается — физическая RAM, heap size → маскируются под стандартные значения — системный промпт: блок , который CC вставляет в каждый запрос (Platform, Shell, OS Version, рабочая директория) → тоже перезаписывается — OAuth-токен менеджится централизованно: клиентские машины вообще не контактируют с platform.claude.com

Три слоя защиты:

env vars — Claude Code добровольно роутит трафик через гейтвей
clash rules — блокируют прямые соединения с anthropic.com на сетевом уровне (страховка от хардкода в новых версиях)
сам гейтвей — перезаписывает все 40+ fingerprint-измерений в реальном времени

Клиентские машины не требуют браузерного логина — гейтвей сам обновляет OAuth-токены.

Почему я осуждаю использование этой темы и думаю что это плохая идея:

Централизованный OAuth-менеджер означает что все ваши токены проходят через чужой прокси. Что происходит с этими токенами — неизвестно))
Это прямое нарушение ToS. Не серая зона — нарушение. Попытка обмануть систему детектирования, думаю, не так сложно ловится)) Где вы возьмёте ещё одну старую гугл почту и зарубежную карту?

Почему случайная проекция не совсем магия

2026-03-30T00:00:00+00:00

Помним ту недавнюю статью? Под капотом там из математики лемма Джонсона и Линденштрауса, она очень круто но непонятно звучит.

“Если у тебя есть много точек в пространстве очень высокой размерности, их можно спроецировать в пространство намного меньшей размерности и при этом все попарные расстояния между точками почти не изменятся.”

Чё? Меняем количество размерностей вниз и расстояние между точками сохраняется? Ну давайте проверим. Сделаем проекцию кубика на плоскость и назовём вершины A...H, а их тени на плоскости A'...H'.

На рисуночке можно выделить CE и C'E'. Давайте явно посчитаем обе. У этих точек одинаковая координата z, так что проекция вообще ничего не теряет:

Обалдеть!!! Оно работает?? Нет, я так просто не поверю. Посчитаем все 28 попарных расстояний между вершинами куба до и после проекции.

По горизонтали и вертикали сами вершины A...H. В каждой заполненной ячейке написано до - после, а строкой ниже - насколько расстояние схлопнулось. Цвет ячейки тоже показывает величину искажения: чем зеленее, тем меньше проекция наврала; чем краснее, тем сильнее всё поехало.

Вот тут то всё становится ясно. Обман)) AH у нас из 3.5 уменьшилось до 1.2!

Но мы на кубе не останавливаемся, друзья мои. Смысл леммы именно в словах “очень высокой размерности”. Попробуем чуть повысить размерность. Посчитаем среднее отклонение у нашего куба:

2D: точки показывают попарные расстояния до и после проекции, подпись внутри графика показывает среднее относительное искажение (20.8%)" />

Среднее относительное искажение тут довольно жирное. Куб вообще плохой кандидат на роль “типичных данных”: он слишком регулярный, слишком игрушечный и слишком привязан к своим осям.

А теперь возьмем столько же случайных точек, примерно в таком же диапазоне попарных расстояний, но уже в 4D и 5D, и посмотрим два одиночных прогона рядом:

3D и 5D -> 4D; среднее искажение в этих прогонах равно 37.7% и 20.2%" />

Получается, пока, не совсем понятно. В одном прогоне 4D может выглядеть даже хуже куба, а 5D уже лучше. Это нормально: точек мало, примеры шумные, глазом тут легко обмануться.

Уже лучше. И это важный кусок интуиции: когда ты теряешь одну координату из трёх, ты ампутируешь треть пространства. Когда теряешь одну координату из пяти, это уже не так драматично.

Короче, строим график:

Это ещё не сама формулировка леммы Джонсона и Линденштрауса, а только разминка перед ней. Но уже видно главное: чем выше исходная размерность, тем менее катастрофичной становится потеря небольшого числа направлений.

Но среднее искажение само по себе немного жулик. Оно может выглядеть прилично, даже если несколько пар точек уже улетели в кювет.

Поэтому вводим более злой критерий. Берем допуск ε и говорим: нас устраивает только такая проекция, где для каждой пары точек новое расстояние d' попадает в коридор вокруг старого d:

На графике “до и после” это не какая-то абстракция, а просто клин вокруг диагонали d' = d. Чем меньше ε, тем уже клин и тем вреднее проверка. Чем больше ε, тем легче объявить победу, но тем слабее смысл фразы “расстояния почти сохранились”.

16D: оранжевый клин показывает ε-коридор шириной 25% вокруг диагонали, внутри него осталось 172 из 190 пар точек" />

Вот теперь можно честно формализовать, что значит “почти не изменились”. В оригинальной статье Джонсона и Линденштрауса 1984 года запись суше и слегка в других терминах, но смысл уже ровно этот: все пары должны остаться внутри одного и того же ε-коридора.

Важная мысль: магия не в том, что математика заранее нашла “мусорные оси”. Наоборот, в хорошем режиме работает почти случайное сжатие. В высоких размерностях структура расстояний часто оказывается размазана так, что случайный низкоразмерный взгляд всё ещё сохраняет главное.

Именно поэтому в машинном обучении подобные штуки звучат не как философия про геометрию, а как очень практичный вопрос про память, задержку и цену работы модели.

Если записать это в привычной современной нотации, формулировка леммы примерно такая. Для любого набора из n точек и любого 0 < ε < 1 существует отображение в k измерений такое, что для любых двух точек u, v:

То есть все попарные расстояния сохраняются с мультипликативной ошибкой не больше ε.

А главное вот что: нужная размерность k растёт не от исходной размерности пространства, а примерно как логарифм числа точек, делённый на ε^2. В одной из стандартных оценок достаточно взять:

Вот где и сидит настоящий прикол. Тебе не нужно тащить исходные 10000 или 100000 координат. Если точек конечное число, а небольшое искажение терпимо, то можно ужать пространство в разы и иногда на порядки, не убив геометрию.

Думайте. Ну или не думайте

2026-03-17T00:00:00+00:00

Гарри Тан, CEO многоизвестного Y Combinator, на прошлой неделе выложил на GitHub репозиторий с промптами для Claude Code. Назвал своё изобретение gstack. Внутри это markdown-файлы с ролями: CEO Review, Engineering Manager, Release Manager, QA, ну идея совсем не сложная: держать AI в отдельных “режимах”, чтобы он не смешивал планирование с шиппингом.

Один скилл в gstack получил респект со стороны вайбкодеров: /plan-ceo-review. Оценить рынок, найти реальную возможность, спросить “зачем это строить” до того как начнёшь. Тан пропустил через себя тысячи стартапов — его продуктовая интуиция в промпте это не маркетинг, это реальный актив. Если хочешь проверить идею или понять масштаб — вот где он действительно компетентен.

Но этот скилл один из пятнадцати. Рядом Engineering Manager, Release Manager, QA. И вот с этим уже вопрос: человек, который хорошо умеет оценивать рынки, упаковал это в полный инженерный процесс — как будто продуктовая интуиция автоматически распространяется на архитектуру и шиппинг. Менеджеры, неделю назад узнавшие что такое Claude Code, уже рассказывают разработчикам как правильно работать с AI. Опять же, никто не спорит, гейткипинг это плохо и надо поощрять людей которые приходят!

Отдельная ирония: tech-журналюги освещают gstack в восторженных тонах. Таких статей несколько, все под копирку — автор просит Claude оценить gstack, Claude хвалит. Круг галлюцинаций с положительной обратной связью: Claude помогал Тану строить уверенность в своём стэке, 20 тысяч звёзд на GitHub подтвердили что всё верно, и теперь тот же Claude пишет пресс-ревью на свою же работу.

Исследование 2023 года от Anthropic: крупные модели стабильно ведут себя подобострастно — стараются выдать ответ, совпадающий с точкой зрения пользователя. Модели обучены с вами соглашаться((

В 2025 году в Nature Machine Intelligence — участники систематически переоценивали точность ответов LLM. Длинные ответы делали людей увереннее, даже когда дополнительный объём не добавлял никакой точности. AI просто звучал более основательно! Люди верили длине, не содержанию.

И последний из интересных: в октябре 2025 года вышло исследование Aalto University, ~ 500 участников решали задачи из LSAT (логические вопросы уровня юридической школы). Половина использовала ChatGPT, половина нет.

Группа с ChatGPT справлялась объективно лучше, это ожидаемо. Но абсолютно каждый пользователь AI переоценил свой результат. Те, кто считал себя “AI-грамотными” — люди с техническим пониманием инструментов — переоценивали больше всего! Причем большинство участников копировали вопрос в ChatGPT, получали ответ и принимали его. Один промпт. Никаких follow-up вопросов))) Более научное название такого явления — cognitive offloading, то есть человек передаёт мышление машине и не просит его обратно, “подумай за меня”.

Корпы делают вид что это исправляют…

Апрель 2025. OpenAI обновили GPT-4o — сделали его более “интуитивным и поддерживающим”. Честно, я тогда активно пользовался но ничо не заметил. Однако юзеры сразу начали сообщать о странном поведении: модель поддерживала бизнес-идею описанную как полный мусор, поощряла человека, сказавшего что он прекращает принимать лекарства, отвечала на тревожные признания фразой “я горжусь тобой, что ты это говоришь”.

Многоуважаемый Сэм Альтман написал в Твиттере что “последние обновления сделали GPT-4o слишком подхалимским”. Откат якобы занял четыре дня. Хотя, честно, до сих пор я в плане критики меньше доверяю гпт. Ну слишком он дружелюбно настроен.

Есть такие мысли, что в OpenAI ллм оптимизировалась под “нравится ли это пользователю прямо сейчас” вместо “реально ли это помогает пользователю”.

Менеджеры стали инженерами…

IBM в мае 2025 опросил 2000 CEO из 33 стран. 61% сказали что активно внедряют AI-агентов.

Это люди, которые получили инструмент, постоянно с ними соглашающийся. Который строит детальные бизнес-кейсы под любую идею которую им принесёшь. Который не играет роль адвоката дьявола — он играет роль придворного. Именно поэтому gstack от CEO YC выглядит снаружи совершенно нормально, почти авторитетно. Потому что CEO провёл сотни часов в диалоге с системой, которая никогда не говорила ему “это плохая идея”.

Что реально помогает

Исследователи из Aalto сформулировали проблему в одном предложении: AI делает вас эффективнее, но хуже понимать насколько вы реально эффективны.

Я не исследователь. Но я использую ровно ОДНУ технику спасения от такого поведения. Конкретная враждебная роль! “Ты — конкурент, который считает что наш план провалится. Объясни почему, с конкретикой.”. Нужна роль с мотивацией, которая имеет с вами явный конфликт интересов. Грубо говоря, всю эту вежливость и подобострастность направляем против себя. Пишу своё резюме — прошу ревью со стороны работодателя. Спорю с управляющей компанией — прошу сыграть роль ИХ юриста. Пишу код — готовлюсь к замещению агентами.

Источники

ЭР ЭЛ ЭМ

2026-03-16T00:00:00+00:00

Чем больше токенов в контексте, тем хуже модель рассуждает над каждым из них. Фундаментальное свойство “attention”, общее для всех моделей. На 1M токенах даже опус 4.6 перестаёт быть полезен.

Идея RLM: использовать контекст как внешнюю среду, а не место куда надо всё запихать.

Весь длинный контекст хранится как переменная в персистентном Python (или каком-то другом) REPL. Модель его не видит, пишет код чтобы с ним взаимодействовать: читает кусками, строит индексы, делает срезы. Как разработчик с SQL базой: смотришь на данные через запросы, не грузишь всю базу в память.

Задача: найти паттерн ошибок в JSON-логе на 50MB (~10M токенов, 2.8M событий).

Шаг	Обычный агент (read_file) — что в контексте	Токены	RLM — что в контексте	Токены
Системный промпт	`"You are a helpful assistant..."`	50	`"Your context: 52 428 800 chars. Available: context, llm_query(), FINAL()"`	70
Запрос	`"Найди паттерн ошибок в логах"`	60	`"Найди паттерн ошибок в логах"`	80
Чтение файла	Tool call `read_file("app.log")` → `{"level":"error","msg":"timeout","svc":"auth"...` (середина JSON-объекта, структура сломана)	560	`>>> import json; data = json.loads(context)` → `[stdout: 31 chars · "Loaded: 2 847 291 events"]`	110
Агрегация	ещё вызовы `read_file` с разными офсетами — фрагменты без связи, агрегировать нельзя	1060	`>>> errors = [e for e in data if e['level']=='error']; print(len(errors), errors[0])` → `[stdout: 61 chars · "18 442 errors · {'ts':'2026-01-14T03:12:01','svc':'auth'..."]`	160
Группировка по сервису	(нет единого представления данных — файл читается кусками)	—	`>>> from collections import Counter; print(Counter(e['svc'] for e in errors).most_common(5))` → `[stdout: 78 chars · "[('auth', 9821), ('payments', 5302)...]"]`	210

Основной смысл на который тут стоит обратить внимание — слева всё копится в контексте в надежде на то что attention сможет сделать агрегацию во время инференса. Справа же нагрузка на attention сильно ниже тк контекст следит за переменными/синтаксисом питона/etc, не за сырыми данными. Если в контексте лежат структурированные данные — JSON, CSV, XML — модель может распарсить их питоном и делать с ними что угодно: фильтровать, агрегировать, трансформировать. Точечный поиск по всему объёму данных — один вызов string.find()!

И, конеш, как и для любого нового концепта, есть впечатляющие бенчмарки:

BrowseComp+ (1000 документов, 6–11M токенов — ответ на каждый вопрос разбросан по нескольким из них, нужно сшить):

RAG + BM25: 51%
Summary agent: 70.5%
RLM (GPT-5 корень + GPT-5 mini субвызовы): 91.3%

OOLONG-Pairs (нужно обработать все пары записей в документе и агрегировать результат — квадратичная по сложности задача):

Чистый GPT-5: <0.1%
RLM с GPT-5: 58%

Claude Code же уже так делает?

“Так это ж просто субагенты, мы так уже делаем.. мой клодкод всё это умеет… он скрипты внутри запускает!”. И частично это справедливо — паттерн не новый и результаты похожи. Но есть три конкретных отличия которые важны.

Посмотрим на то, куда физически попадают данные в каждом случае.

Наивный агент: read_file → текст файла в контексте оркестратора. Вместе с system prompt и километрами обсуждений/вызовов инструментов/etc.

Claude Code с субагентами: файл читается внутри изолированного субагента, в контекст оркестратора идёт только резюме. Лучше — но резюме всё равно токены в истории. И с каждым следующим субагентом их становится больше. К тому же данную фичу клод использует достаточно…консервативно. И скорость потребления токенов ВЗЛЕТАЕТ так, что недельную “норму” можно оприходовать за два “продуктивных” вечера.

В RLM же мы видим такую картину: файл → Python-переменная в REPL. Ни в чьём контексте. В системном промпте модели написано только: “у тебя есть переменная context, используй llm_query() для субзапросов, FINAL() для финального ответа”. Модель пишет код — data[100000:150000], Counter(e['svc'] for e in errors) — получает маленький stdout. Только он идёт в историю. Сам файл остался переменной. Это именно то что показано в таблице выше: оркестратор на 10M токенов данных держит в контексте ~210 токенов.

Рекурсия происходит внутри кода, не в истории сообщений. Вызов агента в Claude Code — событие в диалоге, оно логируется. В RLM рекурсия — Python-функция в REPL:

>>> auth_errors = [e for e in data if e['svc'] == 'auth'][:500]
>>> pattern = llm_query(auth_errors, "найди паттерн ошибок")
[stdout: 43 chars · "timeout на /api/refresh после 2AM UTC"]

Субагент получил 500 записей, думал сколько угодно токенов — оркестратор увидел одну строку. pattern — просто переменная.

Авторы в статьях разграничивают: агент — это автономия, пространство действий, цикл наблюдения. RLM — это REPL для управления длинным контекстом. В общем, RLM может быть внутри агента, но текущие агенты != RLM.

Почему этого нет в продакшне

Нам рассказывают что в Anthropic уже кодят агенты и решают любые задачки, время между теорией и продом сокращается в разы. Так почему ж мы этого не видим?

Вышел независимый reproduction paper (“Think, But Don’t Overthink”) и несколько практических тестов на DeepSeek v3.2 / Kimi K2.

Глубина рекурсии > 1 ломает всё. Kimi K2, который сам по себе делает 86.6% на задачах с длинным контекстом, под RLM depth=1 (корневая модель вызывает субагента — один уровень) падает до 60%, при depth=2 (субагент сам запускает ещё субагента — два уровня вложенности) — до 55%. RLM сделал сильную модель хуже. DeepSeek на depth=2 тоже деградирует: 42% → 34%. Теоретическая красота истинной рекурсии разбивается о то что модели в ней не умеют надёжно работать(( ну по крайней мере ПОКА что не умеют

Три задокументированных сценария отказа: параметрическая галлюцинация (модель игнорирует контекст и отвечает из обучающих весов), потеря структуры вывода (возвращает сырой Python вместо ответа), бесконечные циклы псевдоверификации (без финального ответа). Задержка при двух уровнях рекурсии вырастает с 3.6 секунды до 344 секунд, абсолютная руина

Работает только на моделях с сильным кодингом. Модель должна сама написать корректный Python для неизвестной структуры данных — слабее базовый уровень кодинга, хуже результат( Конечно там можно добавить хакерские вещи типа проверки кода и итерации пока не получим корректный вариант… Но, кмк, основная идея в том что ЛЛМка достаточно умна чтобы ваншотить код а не сидеть его дебажить итерационно.

Помимо теоретической есть инфраструктурная сложность: постоянная сессия Python REPL с доступом к данным пользователя — это переписывать весь текущий sandbox, совсем другой мониторинг и точки отказа. Стандартная инфраструктура не хранит состояние (писал об этом в прошлых постах) итд

Будет ли в эксплуатации? Вероятнее всего, да. Теория вышла в декабре 2025, воспроизводящая работа — в марте 2026. Цикл от “интересный препринт” до “в работе” обычно год+. Сценарии отказов имеются — но, понятно, что это не SOTA модели и в целом они не были натренированы на существование внутри REPLa.

Источники

Разработчики не терпилы

2026-03-15T00:00:00+00:00

Пол Конингэм из Сиднея — айтишник, дата/ML-спец. Его собачка Розочка заболела раком. Ветеринары дали ей от одного до шести месяцев. Рак мастоцитов — хирургия, химиотерапия, иммунотерапия только замедляли болезнь.

Пол потратил ~$3k на секвенирование ДНК опухоли, прогнал мутации через ChatGPT и AlphaFold, спроектировал кастомную mRNA-вакцину. Попросил команду UNSW RNA сделать её физически. Самый долгий шаг — не секвенирование и не моделирование. Три месяца ушло на этические согласования и бюрократические документы.

Опухоль уменьшилась на 75%. Профессора подтвердили: вакцина легитимна.

Пол не биолог и не фармацевт. Умеет обращаться с данными, строить пайплайны, формулировать задачи. Остальное дали инструменты.

Щас со всех сторон трубят о бесполезности айтишников. У разработчиков определённо есть минусы. Я понимаю, почему с нами никто не хочет работать:

не ходим в душ
жмотимся и не тратим бабосы на жизненные удовольствия
не социализируемся
имеем странное чувство юмора

Но мы умеем быстро разбирать чужие системы, структурировать хаос и собирать пайплайны из разрозненной информации. Что, по-вашему, мы будем делать, когда нас начнут выгонять из уютных офисов Сбера и Яндекса, заменяя на skills.md + Claude Opus 4.9? Думаете, пойдём плакаться друг другу и билдить очередной убыточный B2C SaaS?)))

Инженеры, биологи, юристы — мы придём конкурировать за ваше рабочее место. Большая часть работы в этих профессиях — поиск, структурирование, координация. Мы умеем это делать. С ллмками цикл вхождения в чужой домен стал ещё короче.

Но нет!! Моя РАБота слишком сложна и за пол годика вы ничего не поймёте!!

Во Вьетнаме военные корпсмены (медбратья ВМФ США) делали на практике то, что гражданская система потом отказывалась признавать: сортировку раненых, экстренные процедуры, самостоятельную работу там, где врача не было рядом. Базовая подготовка корпсмена — 19 недель. После этого часть шла прямо к морским пехотинцам в поле и выполняла там работу, на которую у гражданского медика уходят годы лицензированного обучения. Дома эта компетентность исчезала на бумаге. Чтобы работать легально, нужно было заново покупать входной билет — платное гражданское переобучение с нуля.

В 1965 году профессор Duke University Eugene Stead запустил первую программу Physician Assistant из бывших корпсменов. Stead легализовал компетентность, которую гражданская медицина упорно отказывалась признавать.

На войне тебе доверяют спасать людей. В мирной системе — сначала купи правильную бумажку. Медсёстры-анестезиологи (CRNAs), которые делают ту же работу что анестезиологи-врачи, получают организованное сопротивление каждый раз, когда пытаются расширить независимую практику.

Война убрала барьеры принудительно. Барьеры оказались организационными. Профессию защищал контроль входа, а не сложность самой работы. Когда в профессию врывается поток мотивированных людей с коротким циклом обучения, часть “ремесла избранных” превращается в воспроизводимый пайплайн.

Что на самом деле защитит вас на РАБочем месте

Регуляция и лицензии. Врач без диплома не подпишет рецепт. Юрист без адвокатского удостоверения не выступит в суде. Реальная стена. Гейткипинг как в истории выше.

Физическое присутствие и доверие. Десять лет в одной компании — это не только экспертиза. Это репутация и политический капитал.

Реальная экспертиза, которая не в тексте. Есть знание, которое не оцифровано. Хирург знает что-то руками. Переговорщик — интуицией. AI про такие вещи понятия не имеет, как и большинство людей снаружи.

Всё остальное — переложение бумажек, форматирование отчётов, проведение совещаний, координация через email — защищает всё хуже. Если значимая часть вашей работы уже лежит в текстах, таблицах и регламентах, другие могут быстро её применить.

Угроза не только сверху

Стандартный совет в эпоху AI: “станьте незаменимым экспертом”. Углубляйтесь, специализируйтесь, делайте то, что AI не умеет.

Но пока вы углубляетесь в свою нишу, в неё с другой стороны заходит человек с другим бэкграундом и инструментами, которые компенсируют отсутствие глубины скоростью. И предлагает работу дешевле.

Вертикальное замещение — это AI вместо вас. Горизонтальное — инженер из другой профессии вместо вас. Первое можно переждать. Второе бьёт быстрее: инженер не ждёт, пока подешевеет, он ищет где применить навыки и продать труд дороже.

Выгоняют из удалёнки на 400к в бигтехе? Нас это устраивает. Если ваша деятельность высоко оплачивается и включает агрегацию и структуризацию информации, мы уже смотрим на ваше тёплое креслице.

ИСПУГАЛИСЬ?? Да лажно вам, обратных примеров тоже достаточно.

Кори ЛаШанс — инженер-механик, промышленное трубопроводное строительство, Хьюстон. Работает с химическими заводами и нефтеперерабатывающими предприятиями. Он построил приложение, которое читает изометрические чертежи трубопроводов и автоматически извлекает всё: количество сварных швов, характеристики материалов, коды комплектующих.

Десять минут на один чертёж стали 60 секундами. Сто чертежей — пять минут.

Кори вайбкодил восемь недель, параллельно с основной работой. За это время с нуля освоил Claude Code, терминал, VS Code. Его цех использует приложение каждый день. Когда он объясняет коллегам что сделал, они смотрят на него как на инопланетянина.

«Я сделал это без чьей-либо помощи — только AI. Любимые инструменты: скриншоты, пошаговые инструкции и просьба к Claude объяснить как будто мне пять лет.»

Горизонтальные переходы идут в обе стороны. Разработчики идут в чужие домены. Специалисты из других областей осваивают инструменты, которые раньше требовали найма программиста. Барьеры не исчезают — стоимость их перехода падает. Интересных историй будет больше!

Источники

Сокращаем потребление токенов БЕСПЛАТНО!

2026-03-15T00:00:00+00:00

Недавно ко мне обратились с просьбой помочь с вайбкодингом. Назвали три проблемы: Claude жрёт слишком много токенов, новые фичи добавляются очень долго и ломают предыдущие, сложный или ненадёжный деплой.

Я отвечаю людям с таким запросом, как мне кажется, наиболее здраво. Предлагаю вместо подбора магического стэка, секретных практик CLAUDE.md, каких-то нишевых расширений MCP серверов с SKILLS.md … просто задуматься чё вообще они делают и начать понимать то, что выплёвывает LLM. То есть, непосредственно, стать разработчиком! ШОК. Мы же пытаемся от них избавиться… но ведь… программисты… ВСЁ…

Знаете, как будто бизнес ждёт очередного чуда — вот-вот будет машина, которая полностью заменит всех разрабов)) Ну, смотрите, там уже компиляторы клод пишет! Нужно просто сделать более грамотный CLAUDE.md, надо просто скопипастить startup project вот смотрите умные люди с github приготовили как раз для небольших стартапов… Просто хочется чтобы за меня ВСЁ сделали! То есть хочется черную коробочку которая бы решала все мои проблемы!

У меня один вопрос: вам вообще комфортно с тем, что ваш продукт работает на чёрной коробке, о внутренностях которой вы ничего не знаете? Мне, честно, не очень…

Проблема 1: Выбор технического стэка

У меня выборка не большая но я вижу что ребята на вопросы о техническом стэке говорят ЛЛМкам “давай сделаем просто, потом допилим”. С одной стороны в чём они не правы. Реально же все хотят сделать “просто”! И спорить не с чем, я-то и сам, разраб, пытаюсь сделать как можно проще.

Но вот нюанс: а мы делаем проще для кого? Для ллки? Для себя? Для клиентов? А как мы можем выбрать простое решение если мы не сказали ЛЛМке что именно нам технически требуется? У меня нет четкой статистики но я ЧУВСТВУЮ паучьим чутьём что для ЛЛМки “просто” = react / python+jinja+vanilla js. Откуда она знает, у нас будет много интерактивности на стороне клиента или сервера? Нужно данные сохранять локально или иметь БД? Откуда ллмка знает, у нас будет мобильное приложение? Может у вас есть в голове идеи прикрутить реалтайм чат? Я честно хз в чём проблема потратить пару деньков посмотреть технических видосов со сравнением какой техстэк когда применять. Ну или самое простое - напрямую початиться об этом с LLM. Написать все планы на проект “мне нужен сайт похожий на профи ру где заказчик заполняет заявку Х и потом идёт проверка У …” - составить подробный диздок ПЕРЕД началом разработки. И дать ллмке время подумать как это РЕАЛЬНО ПРОСТО реализовать.

Мой совет архитектуры веба для начинающих вайбкодеров с целью экономить токены:

uv python fastapi(sync) jinja htmx alpine daisyui(cdn).

Использовать на свой страх и риск.

Проблема 2: Не следить за LOC

Я бы относился к коду как к стоимости которую мы платим за какую-то фичу. То есть любая доп строка — не важно это конфиг или бизнес-логика или SQL — стоит какое-то количество “валюты”. Это лишний контекст, лишние токены, лишняя сложность в конце концов. Самый ад начинается тогда, когда немало строк становятся “мёртвыми” — то есть строки кода никогда не исполняются! Они буквально не нужны… но они все равно тратят токены и усложняют код. Ллмка кушает их и может приходить к абсолютно неверным заключениям… отсюда и отвал уже рабочего функционала. Если вам впадлу прямо следить за каждым файликом то я советую хотя бы изредка запускать утилиту по подсчёту LOC проекта и сравнивать с какой-то предыдущей версией.

Относиться к этому так: мы добавили функционал фильтрации по частичному вводу идентификатора. Нам это стоило +440 строк и +2 файла. Можете даже у ЛЛМ спросить нормальная ли это “цена” за такую фичу или вас заскамили.

И ещё пара вещей пока не забыл:

Текущий клод ваншотит порядка 90% не сложных задач. Если вы не можете “подвинуть кнопочку” или “перекрасить сайдбар” или “пересчитать колонку” уже полчаса — в проекте ЯВНО чёто не так. Я бы рекомендовал общаться с LLM уже не “вот надо теперь прибавить тут 12.46” — я бы уже начинал спрашивать “а почему эта задача занимает столько времени?”. Я бы такие ситуации трактовал как сигналы о том, что настало время изменить инструментарий для выполнения вашей задачи.
Поток данных. Откуда у вас берутся данные? Сохраняются ли они вообще или используются один раз на каждый запрос? Какие API внешние используем? Что хранится на сервере или облаке? Что будет если не заплатим? Есть бекапы? А мб бэкапим данные которые в целом не особо то и важны?
Секреты. Ваша LLM без зазрения совести прочитает ваш .env, ребят)) Я, лично, шифрую ценные данные и даю возможность читать мой конфиг, там ничего полезного нет. Решение не идеальное тк ЛЛМ чисто технически может найти на компе ключ и расшифровать. Но у вас вообще хоть какое-то решение этой проблемы есть?

И, конечно, Git!

Git решает конкретные задачи: История изменений. Возможность откатиться. Посмотреть текущий diff (как раз тот самый промежуточный результат). Пуш, коммит, пулл, мердж реквест… Плюс рекомендую глянуть базу того, как именно гит связан с деплоем, узнать что такое ci/cd и подумать нужен ли он конкретно вам.

Я не то чтобы верю в идеальную чёрную коробку

LLM выдаёт человекочитаемые промежуточные результаты. Код — это текст. Объяснения — текст. Архитектурные решения — текст. Вы можете остановиться в любой момент, прочитать что происходит, и сказать “нет, не туда”.

Если бы LLM сразу писала бинарник — ей было бы мало смысла. Вы бы просто получали исполняемый файл и надеялись что он делает то что нужно. Никакого контроля. Но именно потому что результат читаемый — у вас есть точки входа для коррекции на каждом шаге. Это и есть основная фича которая делает инструмент полезным!

Уважаемые вайбкодеры, не бойтесь погрузиться поглубже в ваши инструменты. Это не рокет саенс и от вас никто никаких секретов не скрывает. Вся инфа о разработке ПО в ютюбе, в статьях на хабре, да много где.

Чем больше вы понимаете текст на инопланетном языке, который за вас пишет агент, тем меньше токенов вы тратите, тем дольше живёт ваша архитектура приложения, тем понятнее для вас деплой итд

Context rot: почему модель тупеет посреди разговора

2026-03-06T00:00:00+00:00

Знакомо: длинный чат с агентом, всё шло хорошо, а на 40-м сообщении он начинает путать файлы, забывать что вы договорились тремя сообщениями назад, повторять одни и те же предложения. Вся информация чисто технически в чате есть — он её сам туда написал. Но “полезность” ответов деградирует с каждым шагом.

Это context rot.

Не только вблизи лимита

Интуиция подсказывает: ну окно же 200к токенов, пока я в пределах — всё ок. Нет. Модель с окном в 1M токенов начинает страдать уже на 50к. Деградация не ступенчатая (“работало → перестало”), а плавная — каждый килотокен контекста чуть-чуть снижает качество. Просто на 20к вы этого не замечаете, а на 80к уже бесит.

И это ещё и дорого

Gemini берёт $1.25/M токенов при коротком контексте и $2.50/M при длинном. Больше токенов = дороже и ХУЖЕ одновременно. Платите вдвое больше за ответы которые вдвое тупее. Скам!

Что делать нам, вайбкодерам

Изменились условия — редактируйте сообщение выше, не дописывайте новое. Каждое новое сообщение это +токены в контекст. Отредактировали — контекст не вырос.
Тема сменилась — новый чат. Не продолжайте разговор про деплой в чате где обсуждали архитектуру БД. Это разные контексты, они загрязняют друг друга.
Смотрите на процент оставшегося контекста в Claude Code / Codex. Этот индикатор не декоративный.
Параллельная задачка — другой агент. Не засоряйте контекст текущего. Кстати в Claude Code появилась интересная фича — прямо в середине общения с Sonnet можно попросить запустить подзадачу на Opus.
Skills, MCPs и прочее — не бесплатные. Каждый подключенный MCP сервер это токены в контексте. Каждый skill это описание которое занимает место. Помните пост про налог на контекст?

В следующих постах: RAG, RLM, subagent architectures — как с этим борются (или пытаются бороться).

No-code умер, а его мечта сбылась

2026-03-06T00:00:00+00:00

Был на конференции в прошлом году. Чел рассказывал: у нас вот LOW CODE платформа для тестирования гипотез. Соединяешь два прямоугольника в веб-интерфейсе — вуаля, процесс передачи данных. Из Кафки в Постгрес, из Монги в Кафку! До меня микрофон не дошёл, но первое что хотел спросить — а чем это отличается от Apache NiFi?

Текст > прямоугольники

Моё мнение: текст — лучшее хранилище для алгоритмов. Никакие визуальные решения меня не убеждали.

Хотя бы один вопрос: а что с version control? Текст версионируется, диффается, ревьюится. Визуальные блоки — нет. Окей окей обходы есть))) Тот же NiFi умеет подключаться к гиту. Но возникает вопрос: зачем редактировать блоки визуально, чтобы потом сгенерировать код? Может наоборот — писать код и смотреть визуализацию?

Тренд

Визуальный drag-and-drop no-code в упадке. Вендоры отказываются. Платформы которые вчера продавали “соедини два блока”, сегодня прикручивают AI-генерацию и переименовываются.

Мечта сбылась

И вот что интересно — no-code умер, а его мечта сбылась. Идея “не технический человек создаёт софт” никуда не делась. Но вместо появления очень интеллектуальных соединений прямоугольников в вебе — промпты пишут на естественном языке.

Текст победил дважды: и как способ хранить алгоритмы, и как способ их создавать.

Голубой океан

2026-03-06T00:00:00+00:00

Пока обсуждают изъезженный на западе блэкпил, продают курсы для луксмакса за 100 долларов — находятся смелые люди которые видят в сложившейся ситуации целевую аудиторию и ВОЗМОЖНОСТИ. Тот самый голубой океан! Одинокие платежеспособные ребятки жаждут женского внимания и на помощь им пришли платные подписки на ИИ))

Candy AI запустились в конце 2023, к концу 2025 вышли на $25M ARR. И это не самый большой игрок. Chai AI имеет $30M ARR на 12 человек. $2.5M на сотрудника. Это в 12 раз эффективнее среднего SaaS. И это из тех компаний которые всё-таки решили “легализоваться”.

Как это устроено

Кабанчики арендуют GPU на время из дата-центров. Запускают abliterated модели. Обходят комиссию Google/Apple находясь в вебе. И приносят прибыль!

Abliteration — техника, которая убирает механизм отказа из любой open-source модели без дообучения. На Hugging Face уже тысячи таких моделей. Есть инструмент Heretic, который делает это полностью автоматически — запускаешь одну команду и получаешь расцензуренную модель, которая сохраняет интеллект оригинала.

Порог входа для среднего айтишника: пару вечеров с клодом и десятки долларов.

Вопросы

Легально ли это? Как с этим бороться? Будут ли вообще с этим бороться? Столько вопросов… А пока мы их задаём регуляторам и ждём ответа — смелые и смышлённые набирают себе квартиры на Петроградке.

P.S. Канал не призывает к действиям и не поощряет заработок в серых зонах законодательства.