Точкой входа становятся сервисные учетные записи, облачные репозитории, CI/CD-процессы, контейнерные образы, внешние библиотеки и SaaS-интеграции, связанные с разработкой и эксплуатацией корпоративных систем.
ПодробнееКомпании по-прежнему используют нейросети в основном для решения примитивных задач. Сложные сценарии с участием множества агентов или работающие сразу с несколькими типами данных пока встречаются редко.
ПодробнееА вот и бенчмарки новой модели от Антропика подьехали!
Что интересно:
- 80.8% > 93.9% на SWE-bench Verified (в сравнении с Opus)
- 77.8% > 53.4% на SWE-bench Pro (в сравнении с Opus)
Саму модель не выпустили в публичный доступ, потому что бояться, что оно всё сломает. Но они проект Project Glasswing, в котором дали доступ к модели, для проверки софта на защищенность таким, как Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks и тп.
Модель нашла zero-day уязвимости во всех основных ОС и браузерах. Тысячи критических уязвимостей, часть из которых жила незамеченной 10–27 лет.
Систем кард читать тут:
https://www-cdn.anthropic.com/53566bf5440a10affd749724787c8913a2ae0841.pdf
Новость стала неожиданностью для рынка: сервис набрал бешеную популярность в 2025 году, собрав 1 млн пользователей быстрее, чем ChatGPT. Разбираем, почему американский гигант сворачивает сервис, который называли «следующим рубежом развития соцсетей», и что это означает для индустрии.
ПодробнееМодель вам соврёт. И чем она умнее — тем убедительнее
Вечер. Я сижу, заряженный идеей. Исследую, как Sentry можно срастить с другими инструментами observability, и спрашиваю у модели про Pyroscope. По итогу модель мне рассказывает сказку, что Sentry под капотом использует Pyroscope и нет нужды дублировать сервисы.
Я полный воодушевления и с мыслями об экономии железа сразу потащил это архитектору и лидам. Начинаю убеждать: давайте попробуем, давайте эксперимент. Выступаю бездумной, но очень заряженной прокладкой между ИИ и коллегами.
А потом не могу уснуть, что-то свербит в голове. Не может быть настолько идеальный продукт, покрывающий все корнер-кейсы, и при этом о нём не трубят из каждого утюга. Где-то в полпервого ночи сажусь факт-чекать. Другие модели, ручной поиск. 15 минут работы. Понимаю, что меня жёстко обманули. Утром иду посыпать голову пеплом и извиняться перед людьми, на которых давил.
Почему модели врут?
У OpenAI есть исследование: чем умнее модель, тем охотнее она выдумывает. Механика простая. Модель обучается на пользовательских реакциях. Когда она говорит «я не знаю», получает негативный фидбэк. Когда пытается соврать, появляется развилка: человек либо не проверит и скажет «отличный ответ», либо распознает ложь. Для модели выдумать и попытаться продать — всегда выгоднее, чем честно промолчать.
Где это больнее всего бьёт
В сложной бизнес-логике. Вы можете пойти по всем правилам: Spec-Driven Development, полная документация, TDD, ручная перепроверка — и всё выглядит хорошо. Вроде работает, все довольны. А потом на проде выясняется, что модель допустила мааааленькую ошибку, и ваш код почти правильный. Вы можете не знать об этом неделями. Но это чеховское ружьё, которое вы точно не хотите видеть в своём продукте. Ведь однажды оно стрельнёт.
Что с этим делать
Декомпозируйте. Ничего нового, разбивайте сложную логику на куски поменьше. Промежуточные проверки кратно повышают шанс поймать ошибку до того, как она уедет в прод.
Факт-чекайте то, что звучит слишком хорошо. Моё правило после той ночной истории: если модель рисует картину без единого компромисса, это дополнительный повод задуматься.
Заведите лог сомнительных решений. Один знакомый поделился подходом: добавляешь в системный промт правило «If you are unsure about a decision, log it». Дата, решение, в чём сомнение. Если модель сама фиксирует, где она не уверена, вы хотя бы знаете, куда смотреть первым делом.
Собственный интеллект никуда не делся, не забывайте его включать. Модель не несёт ответственности за то, что вы ей поверили. А вы — несёте.
Он анализирует презентации проектов и формирует обратную связь по каждому разделу, указывая на слабые места и предлагая их доработать. Ожидается, что скорость обработки первых обращений вырастет в десятки раз.
ПодробнееОн будет отвечать за масштабирование ключевых технологических решений VK. В новой роли Ляджин объединит команды разработки по нескольким направлениям, включая социальные платформы, медиаконтент, облачную инфраструктуру, технологии рекламы и генеративного ИИ.
ПодробнееСтруктура вакансий за год почти не изменилась. Большинство предложений по-прежнему адресовано специалистам по информационной безопасности с опытом от одного года до трех лет. Растущий спрос подталкивает вверх и зарплатные предложения для экспертов.
Подробнее









