trueml создаёт базовые модели на трансформерах и весь стек вокруг них — поиск, дообучение и инференс, — чтобы команды внедряли понимание языка, а не возились с инфраструктурой.
Платформа
Предобучение, дообучение, поиск и сервинг спроектированы как единое целое — вы доходите от прототипа до нагруженного сервиса без переписывания с нуля.
Decoder‑only и encoder‑decoder трансформеры, предобученные на отобранном многоязычном корпусе.
Токенизация, NER, классификация, суммаризация и семантический поиск как составные блоки.
Paged attention, continuous batching и speculative decoding для сервинга с низкой задержкой.
Под капотом
Каждая модель trueml построена на трансформере: стеки self‑attention и feed‑forward слоёв, в которых каждый токен параллельно «смотрит» на всю последовательность.
Семейство моделей
От рабочих лошадок для эмбеддингов до многоязычного флагмана — у всех моделей единый API.
| Модель | Тип | Параметры | Контекст | Назначение |
|---|---|---|---|---|
| trueml‑embed | Энкодер | 140M | 8k | Семантический поиск, RAG |
| trueml‑base | Декодер | 1.3B | 16k | Классификация, извлечение |
| trueml‑nlp‑7B | Декодер | 7.2B | 32k | Генерация, рассуждение |
| trueml‑seq | Энк–дек | 3.1B | 16k | Перевод, суммаризация |
Исследования
Делимся тем, что узнаём про attention, токенизацию и эффективный инференс.
Запустите эндпоинт за пару минут. Бесплатный тариф включает 1 млн токенов в месяц.
Получить API‑ключ Документация