使用基于NIM的英智推理微服务

sam2

meta

sam2

SAM 2是一个分割模型,可以快速准确地选择任何视频或图像中的任何对象。

palmyra-creative-122b

writer

palmyra-creative-122b

专为创造性思维和写作设计的强大LLM。

llama-3.2-nv-embedqa-1b-v2

nvidia

llama-3.2-nv-embedqa-1b-v2

世界级多语种和跨语种问答检索。

llama-3.2-nv-rerankqa-1b-v2

nvidia

llama-3.2-nv-rerankqa-1b-v2

有效改进多种来源和多种语文的检索结果。

usdcode

nvidia

usdcode

最先进的LLM 解答 开放的 知识查询 并生成 美元- Python 代码。

llama-3.3-70b-instruct

meta

llama-3.3-70b-instruct

用于推理、数学、一般知识和功能要求的高级法学硕士

cached

university-at-buffalo

cached

这是一个有背景意识的图表元素探测模型,可探测出18类基本元素,不包括地块元素。

nv-yolox-page-elements-v1

nvidia

nv-yolox-page-elements-v1

此功能使用由 NVIDIA 微调的基本 YOLO 模型来探测文档中的图表、 表格和标题 。

paddleocr

baidu

paddleocr

这是来自Baidu研究的开放源码模型, 接收图像作为输入, 在图像上运行 OCR, 并返回图像中的文字及其捆绑框 。

audio2face-3d

nvidia

audio2face-3d

将流传的音频转换成面部混合形状 用于实时的唇合和面部表演

corrdiff

nvidia

corrdiff

生成高分辨率区域气象场的生成降尺度模型。

fourcastnet

nvidia

fourcastnet

FourCastNet预测全球大气中各种天气/气候变量的动态。

deepfake-image-detection

hive

deepfake-image-detection

高级人工智能模型检测面部和识别深层假图像。

llama-3.2-nv-rerankqa-1b-v1

nvidia

llama-3.2-nv-rerankqa-1b-v1

有效改进多种来源和多种语文的检索结果。

llama-3.2-nv-embedqa-1b-v1

nvidia

llama-3.2-nv-embedqa-1b-v1

世界级多语种和跨语种问答检索。

nemotron-4-mini-hindi-4b-instruct

nvidia

nemotron-4-mini-hindi-4b-instruct

一种双语的印地语-英语可持续土地管理,用于解释性推论,专门为印地语定制。

granite-guardian-3.0-8b

ibm

granite-guardian-3.0-8b

侦查破狱、偏见、暴力、亵渎、性内容和不道德行为

granite-3.0-8b-instruct

ibm

granite-3.0-8b-instruct

支持RAG、汇总、分类、代码和代理AI的高级小语言模型

granite-3.0-3b-a800m-instruct

ibm

granite-3.0-3b-a800m-instruct

RAG、概述、实体提取和分类方面的高度高效专家混合模式

edify-360-hdri

shutterstock

edify-360-hdri

利用Shutterstock许可的创意图书馆对NVIDIA Edify进行训练。

llama-3.1-nemotron-70b-instruct

nvidia

llama-3.1-nemotron-70b-instruct

Llama-3.1-Neprotron-70B-Instruct是荷兰荷兰语研究所定制的一种大型语言模型,目的是提高LLM答复的有用性。

zamba2-7b-instruct

zyphra

zamba2-7b-instruct

为谈话和推理任务设计的高效的州空间混合模型。

llama-3.1-swallow-70b-instruct-v0.1

institute-of-science-tokyo

llama-3.1-swallow-70b-instruct-v0.1

主权大赦国际模式,关于理解区域细微差别的日语的培训。

llama-3.1-swallow-8b-instruct-v0.1

institute-of-science-tokyo

llama-3.1-swallow-8b-instruct-v0.1

主权大赦国际模式,关于理解区域细微差别的日语的培训。

studiovoice

nvidia

studiovoice

通过纠正常见的音频变质,创造演播室优质语音输出,加强演讲能力。

mistral-nemo-minitron-8b-8k-instruct

nvidia

mistral-nemo-minitron-8b-8k-instruct

最先进的小型语言模式,为聊天机、虚拟助理和内容生成提供高度准确性。

llama-3.1-nemotron-70b-reward

nvidia

llama-3.1-nemotron-70b-reward

支持RLHF更好地与人类的喜好保持一致的奖励模式领先板。

llama-3.2-3b-instruct

meta

llama-3.2-3b-instruct

具有语言理解性、高超推理和文本生成的先进最先进的小型语言模式。

llama-3.2-11b-vision-instruct

meta

llama-3.2-11b-vision-instruct

尖端视觉语言模型在图像的高质量推理方面优异。

llama-3.2-90b-vision-instruct

meta

llama-3.2-90b-vision-instruct

尖端视觉语言模型在图像的高质量推理方面优异。

llama-3.2-1b-instruct

meta

llama-3.2-1b-instruct

具有语言理解性、高超推理和文本生成的先进最先进的小型语言模式。

llama-3.1-nemotron-51b-instruct

nvidia

llama-3.1-nemotron-51b-instruct

独特的语言模式,能够提供不相称的准确效率业绩。

qwen2-7b-instruct

qwen

qwen2-7b-instruct

中文和英文LLM针对语言、编码、数学、推理等。

dracarys-llama-3.1-70b-instruct

abacusai

dracarys-llama-3.1-70b-instruct

精密Llama 3.1 70B 代码生成、总结和多语言任务模型。

alphafold2-multimer

deepmind

alphafold2-multimer

从氨基酸序列中预测蛋白质的三维结构。

consistory

nvidia

consistory

在一系列图像中生成一致的字符,无需额外培训。

vila

nvidia

vila

理解文本/模/视频并做出信息回应的多模式愿景语言模式

ai-generated-image-detection

hive

ai-generated-image-detection

用于检测和管理 AI 生成内容的强有力的图像分类模型。

esm2-650m

meta

esm2-650m

从其氨基酸序列中产生蛋白质嵌入。

alphafold2

deepmind

alphafold2

从氨基酸序列中预测蛋白质的三维结构。

llama-3-taiwan-70b-instruct

yentinglin

llama-3-taiwan-70b-instruct

使用Llama-3建筑,对传统普通话和英语数据的主权大赦国际模型进行了微调。

llama-3-swallow-70b-instruct-v0.1

tokyotech-llm

llama-3-swallow-70b-instruct-v0.1

主权大赦国际模式,关于理解区域细微差别的日语的培训。

phi-3.5-vision-instruct

microsoft

phi-3.5-vision-instruct

尖端的开放型多式联运模式,在图像的高质量推理方面优异。

jamba-1.5-mini-instruct

ai21labs

jamba-1.5-mini-instruct

基于 MOE 的尖端 LLM 旨在在各种生成式 AI 任务中表现出色。

jamba-1.5-large-instruct

ai21labs

jamba-1.5-large-instruct

基于 MOE 的尖端 LLM 旨在在各种生成式 AI 任务中表现出色。

nemotron-mini-4b-instruct

nvidia

nemotron-mini-4b-instruct

最优化的可持续土地管理,用于在设计上推断并微调角色扮演、RAG和功能要求

mistral-nemo-minitron-8b-base

nvidia

mistral-nemo-minitron-8b-base

最先进的小型语言模式,为聊天机、虚拟助理和内容生成提供高度准确性。

phi-3.5-moe-instruct

microsoft

phi-3.5-moe-instruct

高级LLM,基于专家混合法的高级LLM,用于计算高效内容生成

phi-3.5-mini-instruct

microsoft

phi-3.5-mini-instruct

在内存/计算受限环境中,轻量度多语言多语种LLM为AI应用程序供电

nv-dinov2

nvidia

nv-dinov2

NV-DINOv2 是一种视觉基础模型,可为输入图像生成矢量嵌入。

rakutenai-7b-instruct

rakuten

rakutenai-7b-instruct

具有语言理解、高超推理和文本生成的先进、最先进的法学硕士。

rakutenai-7b-chat

rakuten

rakutenai-7b-chat

具有语言理解、高超推理和文本生成的先进、最先进的法学硕士。

nv-grounding-dino

nvidia

nv-grounding-dino

地底迪诺是一个开放词汇 零弹射物体探测模型

BRIA-2.3

briaai

BRIA-2.3

一个企业级文本到图像模型,在符合要求的数据集方面受过培训,产生高质量的图像。

radtts-hifigan-tts

nvidia

radtts-hifigan-tts

自然、高忠贞、英语呼声,供个性化文本到语音服务和语音

megatron-1b-nmt

nvidia

megatron-1b-nmt

能够以32种语言实现平稳的全球互动。

fastpitch-hifigan-tts

nvidia

fastpitch-hifigan-tts

为助教、品牌大使和服务机器人表达并参与英语声音

parakeet-ctc-1.1b-asr

nvidia

parakeet-ctc-1.1b-asr

记录英文抄录的准确性和性能。

parakeet-ctc-0.6b-asr

nvidia

parakeet-ctc-0.6b-asr

最先进的英文抄本精确度和速度。

proteinmpnn

ipd

proteinmpnn

ProteinMPNN是预测蛋白质骨干氨基酸序列的深层学习模型。

florence-2

microsoft

florence-2

愿景基础模型能够执行各种计算机愿景和愿景语言任务。

palmyra-fin-70b-32k

writer

palmyra-fin-70b-32k

财务分析、报告和数据处理专业LLM

shieldgemma-9b

google

shieldgemma-9b

保护伞模型,以确保LLMM公司的反应是适当和安全的

gemma-2-2b-it

google

gemma-2-2b-it

用于边缘应用的高级小语言传说性人工智能模型

usdsearch

nvidia

usdsearch

AI动力搜索,使用文字或图像输入,搜索OpenUSD数据、3D模型、图像和资产。

edify-3d

shutterstock

edify-3d

为3D资产生成提供3D 生成服务

edify-image

gettyimages

edify-image

Getty 图像为4K 图像生成提供的 API 服务,

eyecontact

nvidia

eyecontact

估计一个人在视频中的视角 并调整方向 使它成为正面。

audio2face-2d

nvidia

audio2face-2d

使用肖像照片创建面部动画, 用音频同步嘴部运动 。

usdvalidate

nvidia

usdvalidate

核查未开户美元资产是否与即时RTX制成和基于规则的验证兼容。

chatglm3-6b

thudm

chatglm3-6b

支持中文和英文处理包括聊天机、内容生成、编码和翻译等任务。

mamba-codestral-7b-v0.1

mistralai

mamba-codestral-7b-v0.1

各种节目语言和任务的编写和与代码互动模式。

baichuan2-13b-chat

baichuan-inc

baichuan2-13b-chat

支持中文和英文聊天、编码、数学、教学、解决测验

llama-3.1-405b-instruct

meta

llama-3.1-405b-instruct

用于合成数据生成、蒸馏、聊天机器人推断、编码和具体领域任务的高级LLMLM。

llama-3.1-70b-instruct

meta

llama-3.1-70b-instruct

具有超强背景理解、推理和文本生成力的复杂对话。

llama-3.1-8b-instruct

meta

llama-3.1-8b-instruct

具有语言理解、高超推理和文本生成的先进先进模型。

mistral-nemo-12b-instruct

nv-mistralai

mistral-nemo-12b-instruct

最先进的推理、代码、多语言任务语言模式;在单一的通用通用语言平台上运行。

nv-rerankqa-mistral-4b-v3

nvidia

nv-rerankqa-mistral-4b-v3

为提供概率评分而优化的GPU加速模型,即某一段落含有回答问题所需的信息。

nv-embedqa-e5-v5

nvidia

nv-embedqa-e5-v5

GPU 加速生成用于问答检索的文本嵌入。

nv-embedqa-mistral-7b-v2

nvidia

nv-embedqa-mistral-7b-v2

GPU 加速生成用于问答检索的文本嵌入。

maisi

nvidia

maisi

MAISI是培训前的体积体积(3D) CT 中子扩散生成模型。

deepseek-coder-6.7b-instruct

deepseek-ai

deepseek-coder-6.7b-instruct

提供先进代码生成、完成和填充能力的强大编码模型

phi-3-medium-128k-instruct

microsoft

phi-3-medium-128k-instruct

尖端轻量级开放语言模式,优于高质量的推理。

starcoder2-7b

bigcode

starcoder2-7b

代码完成、汇总和生成的高级编程模型

starcoder2-15b

bigcode

starcoder2-15b

代码完成、汇总和生成的高级编程模型

gemma-2-27b-it

google

gemma-2-27b-it

尖端文本生成示范文本理解、转换和代码生成。

gemma-2-9b-it

google

gemma-2-9b-it

尖端文本生成示范文本理解、转换和代码生成。

llama3-chatqa-1.5-70b

nvidia

llama3-chatqa-1.5-70b

高级LLM,为聊天室和搜索引擎提供高质量的、有环境意识的反应。

llama3-chatqa-1.5-8b

nvidia

llama3-chatqa-1.5-8b

高级LLM,为聊天室和搜索引擎提供高质量的、有环境意识的反应。

nemotron-4-340b-reward

nvidia

nemotron-4-340b-reward

对五个属性的帮助性、正确性、一致性、复杂性和动词性作出分级答复。

yi-large

01-ai

yi-large

英文和中文的强大模型培训,从事各种任务,包括聊天室和创造性写作。

nemotron-4-340b-instruct

nvidia

nemotron-4-340b-instruct

创造多种合成数据,模仿真实世界数据的特点。

mistral-7b-instruct-v0.3

mistralai

mistral-7b-instruct-v0.3

本专卖部遵循指示,完成请求,并产生创造性文本。

nvclip

nvidia

nvclip

NV-CLIP是图像和文字的多式联运嵌入模型。

stable-diffusion-3-medium

stabilityai

stable-diffusion-3-medium

生成高质量图像的高级文本到图像模型

ocdrnet

nvidia

ocdrnet

OCDNet和OCRNet是经过预先培训的模型,分别用于光学字符检测和识别。

palmyra-med-70b-32k

writer

palmyra-med-70b-32k

主要LLM负责在医疗领域作出准确、符合具体情况的反应。

palmyra-med-70b

writer

palmyra-med-70b

主要LLM负责在医疗领域作出准确、符合具体情况的反应。

nv-embed-v1

nvidia

nv-embed-v1

从文本输入中生成高质量的数字嵌入。

solar-10.7b-instruct

upstage

solar-10.7b-instruct

NLP任务中的Excels,特别是教学、推理和数学方面的Excel。

bge-m3

baai

bge-m3

文本检索任务的嵌入模型,优于密度、多矢量和稀少的检索。

breeze-7b-instruct

mediatek

breeze-7b-instruct

提高传统中文语言理解和交流能力LLM。

visual-changenet

nvidia

visual-changenet

视觉变换网在两个图像和输出之间检测像素级变化图,并检测语义变化分解遮罩

codegemma-1.1-7b

google

codegemma-1.1-7b

用于代码生成、完成、推理和以下指导的高级编程模式。

granite-34b-code-instruct

ibm

granite-34b-code-instruct

用于代码生成、完成、解释和多方向转换的软件编程LLMLM。

granite-8b-code-instruct

ibm

granite-8b-code-instruct

用于代码生成、完成、解释和多方向转换的软件编程LLMLM。

retail-object-detection

nvidia

retail-object-detection

高效Det基于目标探测网络,从输入视频中探测100个具体的零售目标。

rfdiffusion

ipd

rfdiffusion

蛋白质粘合器设计蛋白质骨干基因模型。

phi-3-small-8k-instruct

microsoft

phi-3-small-8k-instruct

尖端轻量级开放语言模式,优于高质量的推理。

phi-3-small-128k-instruct

microsoft

phi-3-small-128k-instruct

长长的尖端轻量级开放语言模式,优于高质量的推理。

phi-3-medium-4k-instruct

microsoft

phi-3-medium-4k-instruct

尖端轻量级开放语言模式,优于高质量的推理。

phi-3-vision-128k-instruct

microsoft

phi-3-vision-128k-instruct

尖端的开放型多式联运模式,在图像的高质量推理方面优异。

paligemma

google

paligemma

熟悉理解文字和视觉投入的愿景语言模式,以产生信息回应

sea-lion-7b-instruct

aisingapore

sea-lion-7b-instruct

代表东南亚语言和文化多样性并为其服务LLM

phi-3-mini-4k-instruct

microsoft

phi-3-mini-4k-instruct

轻量级的、最先进的开放的LLM,具有很强的数学和逻辑推理能力。

dbrx-instruct

databricks

dbrx-instruct

通用LLM,在语言理解、编码和RAG方面最先进的表现。

arctic-embed-l

snowflake

arctic-embed-l

GPU 加速生成文本嵌入。

phi-3-mini-128k-instruct

microsoft

phi-3-mini-128k-instruct

轻量级的、最先进的开放的LLM,具有很强的数学和逻辑推理能力。

mixtral-8x22b-instruct-v0.1

mistralai

mixtral-8x22b-instruct-v0.1

MOE LLM遵循指示,完成请求,并产生创造性文本。

llama3-70b-instruct

meta

llama3-70b-instruct

具有超强背景理解、推理和文本生成力的复杂对话。

llama3-8b-instruct

meta

llama3-8b-instruct

具有语言理解、高超推理和文本生成的先进、最先进的法学硕士。

recurrentgemma-2b

google

recurrentgemma-2b

在生成长序列时,以新颖的、基于建筑结构的经常性语言模型为快速推论提供快速推论。

codegemma-7b

google

codegemma-7b

以Google的Gemma-7B模型为基础的尖端模型,专门制作代码和完成代码。

gemma-2b

google

gemma-2b

轻量级语言模型可安装在膝上型计算机、台式计算机或云层上,用于归纳和推理。

embed-qa-4

nvidia

embed-qa-4

GPU 加速生成用于问答检索的文本嵌入。

rerank-qa-mistral-4b

nvidia

rerank-qa-mistral-4b

为提供概率评分而优化的GPU加速模型,即某一段落含有回答问题所需的信息。

stable-diffusion-xl

stabilityai

stable-diffusion-xl

以现实的美学生成图像和惊人的视觉。

kosmos-2

microsoft

kosmos-2

旨在理解和理解图像中的视觉要素的开创性多式联运模式。

deplot

google

deplot

将图象转换成表格的视觉语言理解模型。

neva-22b

nvidia

neva-22b

理解文本/图像并产生信息回应的多模式愿景语言模式

fuyu-8b

adept

fuyu-8b

多种任务,包括图像理解和语言生成的多模式模式。

vista-3d

nvidia

vista-3d

VISTA-3D是一种专门的互动基础模型,用于分解和注解人类解剖。

gemma-7b

google

gemma-7b

尖端文本生成示范文本理解、转换和代码生成。

codellama-70b

meta

codellama-70b

LLM能够产生自然语言的代码,反之亦然。

llama2-70b

meta

llama2-70b

能够产生文本和代码的顶尖大语言人工智能模型,以响应提示。

mistral-7b-instruct-v0.2

mistralai

mistral-7b-instruct-v0.2

本专卖部遵循指示,完成请求,并产生创造性文本。

fq2bam

nvidia

fq2bam

通过运行 BWA-MEM 和 GATK 最佳做法, 生成一个或多个 FASTQ 文件的 BAM 输出 。

deepvariant

nvidia

deepvariant

运行 Google 最优化的 GPU 切换模型的深变方程式, 在所有主要定序器上进行高精度运行 。

stable-video-diffusion

stabilityai

stable-video-diffusion

稳定视频传播(SVD)是一种基因化传播模型,它利用单一图像作为合成视频序列的调节框架。

sdxl-turbo

stabilityai

sdxl-turbo

快速基因化文本到图像模型,可合成单一网络评价中提示的文本中的光现实图像

molmim

nvidia

molmim

MLMIM 运行控制生成, 找到具有正确属性的分子 。

esmfold

meta

esmfold

从氨基酸序列中预测蛋白质的三维结构。

diffdock

mit

diffdock

预测分子如何与蛋白质互动的 3D 结构。

mixtral-8x7b-instruct-v0.1

mistralai

mixtral-8x7b-instruct-v0.1

MOE LLM遵循指示,完成请求,并产生创造性文本。

cuopt

nvidia

cuopt

用于复杂路线优化的世界记录准确性和性能。

qwen2.5-coder-32b-instruct

qwen/qwen2.5-coder-32b-instruct

qwen2.5-coder-32b-instruct

用于跨流行编程语言的代码生成、推理和修复的高级 LLM。

qwen2.5-coder-7b-instruct

qwen/qwen2.5-coder-7b-instruct

qwen2.5-coder-7b-instruct

强大的中型代码模型,具有 32K 上下文长度,擅长多种语言编码。