首页 • 大模型推理API

meta

sam2

SAM 2是一个分割模型,可以快速准确地选择任何视频或图像中的任何对象。

部署

writer

palmyra-creative-122b

专为创造性思维和写作设计的强大LLM。

content generation chat

部署

nvidia

llama-3.2-nv-embedqa-1b-v2

世界级多语种和跨语种问答检索。

embeddings retrieval augmented generation

部署

nvidia

llama-3.2-nv-rerankqa-1b-v2

有效改进多种来源和多种语文的检索结果。

ranking retrieval augmented generation

部署

nvidia

usdcode

最先进的LLM 解答开放的知识查询并生成美元- Python 代码。

openusd synthetic data generation

部署

meta

llama-3.3-70b-instruct

用于推理、数学、一般知识和功能要求的高级法学硕士

reasoning code generation

部署

university-at-buffalo

cached

这是一个有背景意识的图表元素探测模型,可探测出18类基本元素,不包括地块元素。

chart element detection image-to-text

部署

nvidia

nv-yolox-page-elements-v1

此功能使用由 NVIDIA 微调的基本 YOLO 模型来探测文档中的图表、表格和标题。

object detection chart detection

部署

baidu

paddleocr

这是来自Baidu研究的开放源码模型, 接收图像作为输入, 在图像上运行 OCR, 并返回图像中的文字及其捆绑框。

optical character recognition table extraction

部署

nvidia

audio2face-3d

将流传的音频转换成面部混合形状用于实时的唇合和面部表演

speech-to-animation digital humans

部署

nvidia

corrdiff

生成高分辨率区域气象场的生成降尺度模型。

weather simulation ai weather prediction

部署

nvidia

fourcastnet

FourCastNet预测全球大气中各种天气/气候变量的动态。

climate science weather simulation

部署

hive

deepfake-image-detection

高级人工智能模型检测面部和识别深层假图像。

content moderation computer vision

部署

nvidia

llama-3.2-nv-rerankqa-1b-v1

有效改进多种来源和多种语文的检索结果。

ranking retrieval augmented generation

部署

nvidia

llama-3.2-nv-embedqa-1b-v1

世界级多语种和跨语种问答检索。

embeddings retrieval augmented generation

部署

nvidia

nemotron-4-mini-hindi-4b-instruct

一种双语的印地语-英语可持续土地管理,用于解释性推论,专门为印地语定制。

indic chat

部署

ibm

granite-guardian-3.0-8b

侦查破狱、偏见、暴力、亵渎、性内容和不道德行为

guardrail text-to-text

部署

ibm

granite-3.0-8b-instruct

支持RAG、汇总、分类、代码和代理AI的高级小语言模型

small language model chat

部署

ibm

granite-3.0-3b-a800m-instruct

RAG、概述、实体提取和分类方面的高度高效专家混合模式

small language model moe

部署

shutterstock

edify-360-hdri

利用Shutterstock许可的创意图书馆对NVIDIA Edify进行训练。

hdri text-to-360

部署

nvidia

llama-3.1-nemotron-70b-instruct

Llama-3.1-Neprotron-70B-Instruct是荷兰荷兰语研究所定制的一种大型语言模型,目的是提高LLM答复的有用性。

code generation chat

部署

zyphra

zamba2-7b-instruct

为谈话和推理任务设计的高效的州空间混合模型。

chat language generation

部署

institute-of-science-tokyo

llama-3.1-swallow-70b-instruct-v0.1

主权大赦国际模式,关于理解区域细微差别的日语的培训。

sovereign ai large language model

部署

institute-of-science-tokyo

llama-3.1-swallow-8b-instruct-v0.1

主权大赦国际模式,关于理解区域细微差别的日语的培训。

sovereign ai large language model

部署

nvidia

studiovoice

通过纠正常见的音频变质,创造演播室优质语音输出,加强演讲能力。

nvidia maxine speech-to-speech

部署

nvidia

mistral-nemo-minitron-8b-8k-instruct

最先进的小型语言模式,为聊天机、虚拟助理和内容生成提供高度准确性。

small language model code generation

部署

nvidia

llama-3.1-nemotron-70b-reward

支持RLHF更好地与人类的喜好保持一致的奖励模式领先板。

text-to-text reward model

部署

meta

llama-3.2-3b-instruct

具有语言理解性、高超推理和文本生成的先进最先进的小型语言模式。

code generation chat

部署

meta

llama-3.2-11b-vision-instruct

尖端视觉语言模型在图像的高质量推理方面优异。

image-text retrieval visual qa

部署

meta

llama-3.2-90b-vision-instruct

尖端视觉语言模型在图像的高质量推理方面优异。

image-text retrieval visual qa

部署

meta

llama-3.2-1b-instruct

具有语言理解性、高超推理和文本生成的先进最先进的小型语言模式。

code generation chat

部署

nvidia

llama-3.1-nemotron-51b-instruct

独特的语言模式,能够提供不相称的准确效率业绩。

language generation chat

部署

qwen

qwen2-7b-instruct

中文和英文LLM针对语言、编码、数学、推理等。

chinese language generation chat

部署

abacusai

dracarys-llama-3.1-70b-instruct

精密Llama 3.1 70B 代码生成、总结和多语言任务模型。

code generation text-to-text

部署

deepmind

alphafold2-multimer

从氨基酸序列中预测蛋白质的三维结构。

bionemo biology

部署

nvidia

consistory

在一系列图像中生成一致的字符,无需额外培训。

image generation text-to-image

部署

nvidia

vila

理解文本/模/视频并做出信息回应的多模式愿景语言模式

vlm vision language model

部署

hive

ai-generated-image-detection

用于检测和管理 AI 生成内容的强有力的图像分类模型。

content moderation image classification

部署

meta

esm2-650m

从其氨基酸序列中产生蛋白质嵌入。

bionemo protein embedding

部署

deepmind

alphafold2

从氨基酸序列中预测蛋白质的三维结构。

bionemo biology

部署

yentinglin

llama-3-taiwan-70b-instruct

使用Llama-3建筑,对传统普通话和英语数据的主权大赦国际模型进行了微调。

regional language generation code generation

部署

tokyotech-llm

llama-3-swallow-70b-instruct-v0.1

主权大赦国际模式,关于理解区域细微差别的日语的培训。

large language model chat

部署

microsoft

phi-3.5-vision-instruct

尖端的开放型多式联运模式,在图像的高质量推理方面优异。

vision assistant visual question answering

部署

ai21labs

jamba-1.5-mini-instruct

基于 MOE 的尖端 LLM 旨在在各种生成式 AI 任务中表现出色。

chat language generation

部署

ai21labs

jamba-1.5-large-instruct

基于 MOE 的尖端 LLM 旨在在各种生成式 AI 任务中表现出色。

chat language generation

部署

nvidia

nemotron-mini-4b-instruct

最优化的可持续土地管理,用于在设计上推断并微调角色扮演、RAG和功能要求

chat text-to-text

部署

nvidia

mistral-nemo-minitron-8b-base

最先进的小型语言模式,为聊天机、虚拟助理和内容生成提供高度准确性。

language generation text-to-text

部署

microsoft

phi-3.5-moe-instruct

高级LLM,基于专家混合法的高级LLM,用于计算高效内容生成

moe code generation

部署

microsoft

phi-3.5-mini-instruct

在内存/计算受限环境中,轻量度多语言多语种LLM为AI应用程序供电

chat text-to-text

部署

nvidia

nv-dinov2

NV-DINOv2 是一种视觉基础模型,可为输入图像生成矢量嵌入。

image-to-embedding computer vision

部署

rakuten

rakutenai-7b-instruct

具有语言理解、高超推理和文本生成的先进、最先进的法学硕士。

chat text-to-text

部署

rakuten

rakutenai-7b-chat

具有语言理解、高超推理和文本生成的先进、最先进的法学硕士。

chat text-to-text

部署

nvidia

nv-grounding-dino

地底迪诺是一个开放词汇零弹射物体探测模型

object detection computer vision

部署

briaai

BRIA-2.3

一个企业级文本到图像模型,在符合要求的数据集方面受过培训,产生高质量的图像。

image generation text-to-image

部署

nvidia

radtts-hifigan-tts

自然、高忠贞、英语呼声,供个性化文本到语音服务和语音

text-to-speech text-to-speech

部署

nvidia

megatron-1b-nmt

能够以32种语言实现平稳的全球互动。

text translation neural machine translation

部署

nvidia

fastpitch-hifigan-tts

为助教、品牌大使和服务机器人表达并参与英语声音

text-to-speech text-to-speech

部署

nvidia

parakeet-ctc-1.1b-asr

记录英文抄录的准确性和性能。

automatic speech recognition speech-to-text

部署

nvidia

parakeet-ctc-0.6b-asr

最先进的英文抄本精确度和速度。

automatic speech recognition speech-to-text

部署

ipd

proteinmpnn

ProteinMPNN是预测蛋白质骨干氨基酸序列的深层学习模型。

bionemo biology

部署

microsoft

florence-2

愿景基础模型能够执行各种计算机愿景和愿景语言任务。

image classification image

部署

writer

palmyra-fin-70b-32k

财务分析、报告和数据处理专业LLM

finance text-to-text

部署

google

shieldgemma-9b

保护伞模型,以确保LLMM公司的反应是适当和安全的

guardrail text-to-text

部署

google

gemma-2-2b-it

用于边缘应用的高级小语言传说性人工智能模型

code generation chat

部署

nvidia

usdsearch

AI动力搜索,使用文字或图像输入,搜索OpenUSD数据、3D模型、图像和资产。

openusd synthetic data generation

部署

shutterstock

edify-3d

为3D资产生成提供3D 生成服务

image-to-3d text-to-3d

部署

gettyimages

edify-image

Getty 图像为4K 图像生成提供的 API 服务,

outpaint image generation

部署

nvidia

eyecontact

估计一个人在视频中的视角并调整方向使它成为正面。

telepresence nvidia maxine

部署

nvidia

audio2face-2d

使用肖像照片创建面部动画, 用音频同步嘴部运动。

speech-to-animation telepresence

部署

nvidia

usdvalidate

核查未开户美元资产是否与即时RTX制成和基于规则的验证兼容。

validation openusd

部署

thudm

chatglm3-6b

支持中文和英文处理包括聊天机、内容生成、编码和翻译等任务。

chat text-to-text

部署

mistralai

mamba-codestral-7b-v0.1

各种节目语言和任务的编写和与代码互动模式。

code completion code generation

部署

baichuan-inc

baichuan2-13b-chat

支持中文和英文聊天、编码、数学、教学、解决测验

chinese language generation chat

部署

meta

llama-3.1-405b-instruct

用于合成数据生成、蒸馏、聊天机器人推断、编码和具体领域任务的高级LLMLM。

chat code generation

部署

meta

llama-3.1-70b-instruct

具有超强背景理解、推理和文本生成力的复杂对话。

code generation chat

部署

meta

llama-3.1-8b-instruct

具有语言理解、高超推理和文本生成的先进先进模型。

code generation chat

部署

nv-mistralai

mistral-nemo-12b-instruct

最先进的推理、代码、多语言任务语言模式;在单一的通用通用语言平台上运行。

code generation chat

部署

nvidia

nv-rerankqa-mistral-4b-v3

为提供概率评分而优化的GPU加速模型,即某一段落含有回答问题所需的信息。

ranking retrieval augmented generation

部署

nvidia

nv-embedqa-e5-v5

GPU 加速生成用于问答检索的文本嵌入。

embeddings retrieval augmented generation

部署

nvidia

nv-embedqa-mistral-7b-v2

GPU 加速生成用于问答检索的文本嵌入。

embeddings retrieval augmented generation

部署

nvidia

maisi

MAISI是培训前的体积体积(3D) CT 中子扩散生成模型。

image generation medical imaging

部署

deepseek-ai

deepseek-coder-6.7b-instruct

提供先进代码生成、完成和填充能力的强大编码模型

code completion code generation

部署

microsoft

phi-3-medium-128k-instruct

尖端轻量级开放语言模式,优于高质量的推理。

chat text-to-text

部署

bigcode

starcoder2-7b

代码完成、汇总和生成的高级编程模型

code completion code generation

部署

bigcode

starcoder2-15b

代码完成、汇总和生成的高级编程模型

code completion code generation

部署

google

gemma-2-27b-it

尖端文本生成示范文本理解、转换和代码生成。

code generation chat

部署

google

gemma-2-9b-it

尖端文本生成示范文本理解、转换和代码生成。

code generation chat

部署

nvidia

llama3-chatqa-1.5-70b

高级LLM,为聊天室和搜索引擎提供高质量的、有环境意识的反应。

text-to-text non-commercial use only

部署

nvidia

llama3-chatqa-1.5-8b

高级LLM,为聊天室和搜索引擎提供高质量的、有环境意识的反应。

non-commerical use only text-to-text

部署

nvidia

nemotron-4-340b-reward

对五个属性的帮助性、正确性、一致性、复杂性和动词性作出分级答复。

synthetic data generation text-to-text

部署

01-ai

yi-large

英文和中文的强大模型培训,从事各种任务,包括聊天室和创造性写作。

chat text-to-text

部署

nvidia

nemotron-4-340b-instruct

创造多种合成数据,模仿真实世界数据的特点。

synthetic data generation chat

部署

mistralai

mistral-7b-instruct-v0.3

本专卖部遵循指示,完成请求,并产生创造性文本。

chat text-to-text

部署

nvidia

nvclip

NV-CLIP是图像和文字的多式联运嵌入模型。

multimodal embeddings text and image

部署

stabilityai

stable-diffusion-3-medium

生成高质量图像的高级文本到图像模型

image generation text-to-image

部署

nvidia

ocdrnet

OCDNet和OCRNet是经过预先培训的模型,分别用于光学字符检测和识别。

optical character recognition image

部署

writer

palmyra-med-70b-32k

主要LLM负责在医疗领域作出准确、符合具体情况的反应。

text-to-text healthcare

部署

writer

palmyra-med-70b

主要LLM负责在医疗领域作出准确、符合具体情况的反应。

text-to-text healthcare

部署

nvidia

nv-embed-v1

从文本输入中生成高质量的数字嵌入。

non-commercial use only retrieval augmented generation

部署

upstage

solar-10.7b-instruct

NLP任务中的Excels,特别是教学、推理和数学方面的Excel。

non-commerical use only chat

部署

baai

bge-m3

文本检索任务的嵌入模型,优于密度、多矢量和稀少的检索。

embeddings retrieval augmented generation

部署

mediatek

breeze-7b-instruct

提高传统中文语言理解和交流能力LLM。

chat text-to-text

部署

nvidia

visual-changenet

视觉变换网在两个图像和输出之间检测像素级变化图,并检测语义变化分解遮罩

image image generation

部署

google

codegemma-1.1-7b

用于代码生成、完成、推理和以下指导的高级编程模式。

code generation code completion

部署

ibm

granite-34b-code-instruct

用于代码生成、完成、解释和多方向转换的软件编程LLMLM。

code generation chat

部署

ibm

granite-8b-code-instruct

用于代码生成、完成、解释和多方向转换的软件编程LLMLM。

code generation chat

部署

nvidia

retail-object-detection

高效Det基于目标探测网络,从输入视频中探测100个具体的零售目标。

object detection image

部署

ipd

rfdiffusion

蛋白质粘合器设计蛋白质骨干基因模型。

bionemo biology

部署

microsoft

phi-3-small-8k-instruct

尖端轻量级开放语言模式,优于高质量的推理。

code generation chat

部署

microsoft

phi-3-small-128k-instruct

长长的尖端轻量级开放语言模式,优于高质量的推理。

code generation chat

部署

microsoft

phi-3-medium-4k-instruct

尖端轻量级开放语言模式,优于高质量的推理。

chat text-to-text

部署

microsoft

phi-3-vision-128k-instruct

尖端的开放型多式联运模式,在图像的高质量推理方面优异。

image cv

部署

google

paligemma

熟悉理解文字和视觉投入的愿景语言模式,以产生信息回应

image cv

部署

aisingapore

sea-lion-7b-instruct

代表东南亚语言和文化多样性并为其服务LLM

chat text-to-text

部署

microsoft

phi-3-mini-4k-instruct

轻量级的、最先进的开放的LLM,具有很强的数学和逻辑推理能力。

code generation chat

部署

databricks

dbrx-instruct

通用LLM,在语言理解、编码和RAG方面最先进的表现。

chat text-to-text

部署

snowflake

arctic-embed-l

GPU 加速生成文本嵌入。

embeddings retrieval augmented generation

部署

microsoft

phi-3-mini-128k-instruct

轻量级的、最先进的开放的LLM,具有很强的数学和逻辑推理能力。

chat text-to-text

部署

mistralai

mixtral-8x22b-instruct-v0.1

MOE LLM遵循指示,完成请求,并产生创造性文本。

advanced reasoning code generation

部署

meta

llama3-70b-instruct

具有超强背景理解、推理和文本生成力的复杂对话。

code generation chat

部署

meta

llama3-8b-instruct

具有语言理解、高超推理和文本生成的先进、最先进的法学硕士。

code generation chat

部署

google

recurrentgemma-2b

在生成长序列时,以新颖的、基于建筑结构的经常性语言模型为快速推论提供快速推论。

chat text-to-text

部署

google

codegemma-7b

以Google的Gemma-7B模型为基础的尖端模型,专门制作代码和完成代码。

code generation chat

部署

google

gemma-2b

轻量级语言模型可安装在膝上型计算机、台式计算机或云层上,用于归纳和推理。

chat text-to-text

部署

nvidia

embed-qa-4

GPU 加速生成用于问答检索的文本嵌入。

embeddings retrieval augmented generation

部署

nvidia

rerank-qa-mistral-4b

为提供概率评分而优化的GPU加速模型,即某一段落含有回答问题所需的信息。

ranking retrieval augmented generation

部署

stabilityai

stable-diffusion-xl

以现实的美学生成图像和惊人的视觉。

image generation text-to-image

部署

microsoft

kosmos-2

旨在理解和理解图像中的视觉要素的开创性多式联运模式。

image cv

部署

google

deplot

将图象转换成表格的视觉语言理解模型。

multimodal visual language understanding

部署

nvidia

neva-22b

理解文本/图像并产生信息回应的多模式愿景语言模式

image cv

部署

adept

fuyu-8b

多种任务,包括图像理解和语言生成的多模式模式。

image cv

部署

nvidia

vista-3d

VISTA-3D是一种专门的互动基础模型,用于分解和注解人类解剖。

interactive annotation image segmentation

部署

google

gemma-7b

尖端文本生成示范文本理解、转换和代码生成。

code generation chat

部署

meta

codellama-70b

LLM能够产生自然语言的代码,反之亦然。

code generation chat

部署

meta

llama2-70b

能够产生文本和代码的顶尖大语言人工智能模型,以响应提示。

code generation chat

部署

mistralai

mistral-7b-instruct-v0.2

本专卖部遵循指示,完成请求,并产生创造性文本。

text-to-text language generation

部署

nvidia

fq2bam

通过运行 BWA-MEM 和 GATK 最佳做法, 生成一个或多个 FASTQ 文件的 BAM 输出。

parabricks genomics

部署

nvidia

deepvariant

运行 Google 最优化的 GPU 切换模型的深变方程式, 在所有主要定序器上进行高精度运行。

parabricks genomics

部署

stabilityai

stable-video-diffusion

稳定视频传播(SVD)是一种基因化传播模型,它利用单一图像作为合成视频序列的调节框架。

image generation text-to-image

部署

stabilityai

sdxl-turbo

快速基因化文本到图像模型,可合成单一网络评价中提示的文本中的光现实图像

image generation text-to-image

部署

nvidia

molmim

MLMIM 运行控制生成, 找到具有正确属性的分子。

molecule generation drug discovery

部署

meta

esmfold

从氨基酸序列中预测蛋白质的三维结构。

drug discovery protein folding

部署

mit

diffdock

预测分子如何与蛋白质互动的 3D 结构。

docking drug discovery

部署

mistralai

mixtral-8x7b-instruct-v0.1

MOE LLM遵循指示,完成请求,并产生创造性文本。

advanced reasoning code generation

部署

nvidia

cuopt

用于复杂路线优化的世界记录准确性和性能。

route optimization nvidia

部署

qwen/qwen2.5-coder-32b-instruct

qwen2.5-coder-32b-instruct

用于跨流行编程语言的代码生成、推理和修复的高级 LLM。

code completion code generation

部署

qwen/qwen2.5-coder-7b-instruct

qwen2.5-coder-7b-instruct

强大的中型代码模型，具有 32K 上下文长度，擅长多种语言编码。

code completion code generation

部署

使用基于NIM的英智推理微服务

meta

sam2

writer

palmyra-creative-122b

nvidia

llama-3.2-nv-embedqa-1b-v2

nvidia

llama-3.2-nv-rerankqa-1b-v2

nvidia

usdcode

meta

llama-3.3-70b-instruct

university-at-buffalo

cached

nvidia

nv-yolox-page-elements-v1

baidu

paddleocr

nvidia

audio2face-3d

nvidia

corrdiff

nvidia

fourcastnet

hive

deepfake-image-detection

nvidia

llama-3.2-nv-rerankqa-1b-v1

nvidia

llama-3.2-nv-embedqa-1b-v1

nvidia

nemotron-4-mini-hindi-4b-instruct

ibm

granite-guardian-3.0-8b

ibm

granite-3.0-8b-instruct

ibm

granite-3.0-3b-a800m-instruct

shutterstock

edify-360-hdri

nvidia

llama-3.1-nemotron-70b-instruct

zyphra

zamba2-7b-instruct

institute-of-science-tokyo

llama-3.1-swallow-70b-instruct-v0.1

institute-of-science-tokyo

llama-3.1-swallow-8b-instruct-v0.1

nvidia

studiovoice

nvidia

mistral-nemo-minitron-8b-8k-instruct

nvidia

llama-3.1-nemotron-70b-reward

meta

llama-3.2-3b-instruct

meta

llama-3.2-11b-vision-instruct

meta

llama-3.2-90b-vision-instruct

meta

llama-3.2-1b-instruct

nvidia

llama-3.1-nemotron-51b-instruct

qwen

qwen2-7b-instruct

abacusai

dracarys-llama-3.1-70b-instruct

deepmind

alphafold2-multimer

nvidia

consistory

nvidia

vila

hive

ai-generated-image-detection

meta

esm2-650m

deepmind