앱 회사가 AI 벤치마크를 만드는 시대: Sean Cai 앱 회사가 AI 벤치마크를 만드는 시대: Sean Cai
Sean Cai가 말한 app layer benchmark와 RL data 공급망 변화를 정리. Sean Cai가 말한 app layer benchmark와 RL data 공급망 변화를 정리.
2 notes 12개의 노트
No notes match this filter. 이 필터에 맞는 노트가 없습니다.
Sean Cai가 말한 app layer benchmark와 RL data 공급망 변화를 정리. Sean Cai가 말한 app layer benchmark와 RL data 공급망 변화를 정리.
Sean Cai가 말한 RL environment 회사의 다음 시장, enterprise deployment, verifiable workflow, RLaaS 기회를 정리. Sean Cai가 말한 RL environment 회사의 다음 시장, enterprise deployment, verifiable workflow, RLaaS 기회를 정리.
Harvey, Ramp, Sierra, Decagon 같은 앱 레이어 AI 회사들이 frontier API 의존을 줄이고 자체 small model post-training으로 가는 흐름. Harvey, Ramp, Sierra, Decagon 같은 앱 레이어 AI 회사들이 frontier API 의존을 줄이고 자체 small model post-training으로 가는 흐름.
Dwarkesh와 Sasha Rush가 설명한 targeted on-policy self-distillation, HINT-SD, RLVR와 CUA trajectory 데이터의 연결. Dwarkesh와 Sasha Rush가 설명한 targeted on-policy self-distillation, HINT-SD, RLVR와 CUA trajectory 데이터의 연결.
비동기 rollout이 RL throughput을 높이는 방식과 long-horizon CUA에서 policy lag가 왜 핵심 병목인지 정리. 비동기 rollout이 RL throughput을 높이는 방식과 long-horizon CUA에서 policy lag가 왜 핵심 병목인지 정리.
How BJudge improves computer-use agents by running multiple rollouts and selecting the best behavior narrative. 여러 computer-use agent rollout을 실행한 뒤 behavior narrative로 가장 좋은 시도를 고르는 BJudge 방법 정리.
AI 데이터 시장에서 labs가 실제로 사는 outcome과 RL data factory를 정리. AI 데이터 시장에서 labs가 실제로 사는 outcome과 RL data factory를 정리.
좋은 AI 데이터의 기준과 benchmark 착시를 정리. 좋은 AI 데이터의 기준과 benchmark 착시를 정리.
long-horizon 학습 데이터와 real-world data의 품질 문제를 정리. long-horizon 학습 데이터와 real-world data의 품질 문제를 정리.
Sean Cai가 말한 RL environment 회사 판단 기준과 AI 데이터 시장을 볼 때 참고할 포인트. Sean Cai가 말한 RL environment 회사 판단 기준과 AI 데이터 시장을 볼 때 참고할 포인트.
프론티어 랩의 학습 데이터 지출과 고품질 데이터 vendor 부족을 정리. 프론티어 랩의 학습 데이터 지출과 고품질 데이터 vendor 부족을 정리.
One transformer for text, images, video, and audio. Why Luma pivoted from 3D to video to unified, and what the agent shape around it looks like. 텍스트, 이미지, 영상, 오디오를 하나의 transformer로 처리하는 unified 모델. Luma가 3D에서 영상으로, 다시 unified로 피벗한 이유와 그 위에 쌓는 agent 구조.