什么是向量

余弦距离 Cosine 余弦相似度 是指两个向量之间的夹角余弦值,它的计算公式:其中,A 和 B 分别表示两个向量,n 表示向量的维度,·表示向量的点积,A|B|分别表示两个向量的模长。而在DashVector中使用 余弦距离 来表示相似度,余弦距离=1...

功能特性

数据管理 功能集 功能 功能描述 参考文档 存储类型 标准存储 提供高可靠、高可用、高性能的对象存储服务,面向温热数据,适合支持频繁的数据访问。标准存储 低频访问存储 提供高持久性、较低存储成本的对象存储服务。有最小计量单位(64 KB...

单doc多向量检索

功能说明:用户可以在一个doc中的某个向量字段中存储个向量内容进行检索,例如向量维度128维,向量字段中可以存储256(两个向量)、384(三个向量)等等向量维度的整数倍个向量,查询时可以通过向量命中字段中的任何一个向量进行召回。...

配置AD/LDAP/DNS

本文介绍如何通过阿里云云存储网关控制台配置AD/LDAP/DNS。背景信息 活动目录(AD)与轻量级目录访问协议(LDAP)是标准...说明 线上文件网关设置DNS以加入AD域时,请将第一个DNS服务器地址替换域控制器的IP,并保留第二个DNS服务器地址

计费常见问题

已购通用型NAS资源包容量 例如,您购买了一个通用型NAS资源包(100 GiB,1个月),在一个计费周期内,您账号下的容量型NAS文件系统实际存储数据180 GiB,那么在这个计费周期内文件系统先使用资源包抵扣100 GiB,超出的80 GiB存储容量将按量...

方案设计

Variable 变量名,即五维模型中的第一维。Time 时间,即五维模型中的第二维。Z 高度,即五维模型中的第三维。这四列主键列标记一行表格存储中的数据,这行数据需要保存后两维的数据,即一个格点平面。这种设计下,五维中的前三维都可以通过...

现代IM系统中的消息系统—架构

本章节主要介绍现代IM系统中的消息系统架构以及基于表格存储(Tablestore)自研的Timeline模型构建的消息系统。基于Timeline构建的现代消息系统能够同时支持消息系统的多种特性,包括多端同步、消息漫游和在线检索,在性能和规模上能够实现...

推荐的挂载方式

本文介绍阿里云容器服务挂载NAS文件系统的方式,您可以使用CSI存储插件或使用容器网络文件系统CNFS挂载NAS文件系统。重要 请使用以下推荐的方式挂载NAS文件系统。使用其他方式挂载NAS文件系统可能出现稳定性风险,NAS团队无法预估该风险且...

向量计算函数

内积(点积)函数 inner_product(array(double)vector1,array(double)vector2)inner_product(varchar vector1,varchar vector2)dot_product(array(double)vector1,array(double)vector2)计算两个向量的内积。欧氏距离函数 euclidean_...

基本概念

例如,{1:0.4,10000:0.6,222222:0.8} 就是一个稀疏向量,其第1、10000、222222位元素(分别代表三关键字)有非0值(代表关键字的权重),其他元素全部0。QPS(访问频次)每秒能向 DashVector 服务的API发起的最大查询请求次数。QPS越高...

配置存储地址

默认 设置默认存储地址,当您有多个存储地址时,会选中您的默认存储。例如:媒资上传、媒体处理等服务默认存储地址。设临时文件夹 设置剪辑临时文件存储地址。移除 移除存储地址。重要 移除后将无法在智能媒体服务中使用该存储地址,...

语义向量距离

距离的阈值 当两个向量的距离小于此值时输出,默认值+∞。执行调优 计算的核心数 默认自动分配。每个核心的内存(MB)默认自动分配。方式二:PAI命令方式 使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情...

向量聚合

向量聚合组件,可以将多数值列或者向量,聚合成一个向量。使用限制 支持的计算引擎MaxCompute和Flink。算法简介 向量聚合组件,将多数值列或者vector列转换成一个向量。可视化配置参数【输入桩配置】输入桩(从左到右)限制数据类型 ...

字段加密

初始向量 设置加密的初始向量,格式32十六进制字符,默认值 00000000000000000000000000000000。保存路径 用于保存加密参数的文件路径。失败保留原始数据 选中该选项后,如果加密失败,系统将保留原始字段的值。如果未选中该选项,则...

如何使用OSS更省钱?

200 3,328 62,720 资源包+按量付费 通过低频-本地冗余存储包抵扣低频访问-本地冗余容量费用 您可以通过购买规格100 TB,购买时长为1个月的低频-本地冗余存储包用于抵扣低频访问-本地冗余存储容量费用。通过下行流量包抵扣外网流出流量...

创建分析存储

当需要低成本存储时序数据以及快速查询和分析时序数据时,您可以使用CreateTimeseriesAnalyticalStore接口已有时序表创建分析存储。前提条件 已通过控制台创建了开启分析存储的实例。具体操作,请参见 创建时序模型实例。已初始化...

创建分析存储

当需要低成本存储时序数据以及快速查询和分析时序数据时,您可以使用CreateTimeseriesAnalyticalStore接口已有时序表创建分析存储。前提条件 已通过控制台创建了开启分析存储的实例。具体操作,请参见 创建时序模型实例。已初始化...

通过SDK使用分析存储

使用SDK在已开启分析存储的时序模型实例下时序表创建分析存储分析存储创建绑定关系,然后使用SQL查询数据。说明 您可以通过 Java SDK 或者 Go SDK 使用分析存储功能,本文以Java SDK例介绍分析存储的使用。注意事项 时序分析存储...

列数据转向量

将多列数据转换为向量,最终生成的数据只包含列。使用限制 支持的计算引擎MaxCompute和Flink。算法简介 将数据格式从列数据转成Vector,数据格式必须数值类型。可视化配置参数【输入桩配置】输入桩(从左到右)限制数据类型 建议上游...

高斯混合模型训练

假设聚类中心点数量K,输入数据的向量维度M,则每节点需要配置的内存大小:M×M×K×8×2×12,即M×M×K×8×2×12÷1024÷1024 MB。通常每节点的内存配置8 GB。如何预估节点的个数?建议按照输入数据的大小配置。例如:输入...

应用场景

当用户输入查询请求时,向量检索服务 可以将其转换向量表示,然后计算查询向量与向量数据库中所有商品向量的相似度,然后返回相似度最高的几商品向量。另外,还可以基于用户的历史行为和偏好通过向量检索服务 将用户的历史浏览记录和...

设置生命周期策略

您可以基于最后一次访问时间的规则创建生命周期策略,定期将通用型NAS文件系统内的多文件或目录转储指定的存储类型,从而节省存储费用。费用说明 低频存储类型费用说明 低频存储容量费用:根据您转储至低频存储中的文件大小、时长收取...

资源包抵扣规则

假如您在2021年08月12日10:30:30购买了有效期为1个月的1 TiB极速型NAS资源包,则实际抵扣时间需要等到14:00:00左右,系统生成10:00:00~11:00:00这个时间段的按量计费账单时,才开始抵扣10:00:00~11:00:00的极速型NAS配置容量。资源包抵扣...

表格存储建表注意事项

主键的第一列为分区键,可以理解当表的数据量达到一个设定值时,表格存储会根据分区键列值的范围来进行分区的操作,通过分区来达到数据访问负载均衡的目的。建表时,表内的数据默认拥有一个分区,即该表的所有数据在一个数据分区上。当表...

0014-00000044

问题示例 以下请求体XML第一个 Transition 节点下的 StorageClass 取值test,取值非法导致请求错误。PUT/?lifecycle HTTP/1.1 Host:oss-example.oss-cn-hangzhou.aliyuncs.com Content-Length: 336 Date: Mon ,6 May 2019 15:23:20 GMT ...

案例:搭建以图搜图系统

搭建流程 创建图片数据存储表 创建图片数据存储表的SQL语句如下:CREATE TABLE image(id bigint(20)comment '主键id',image_address varchar(255)comment '图片存储地址',type int(8)comment '图片类型',primary key(id));其中,image_...

数据容灾

跨区域复制可满足您的以下业务需求:合规性要求:虽然OSS默认对每个存储的对象在物理盘上有多份副本,但合规性要求所规定的数据需要跨一定距离保存份副本。通过跨区域复制,可以在远距离的OSS数据中心之间复制数据以满足这些合规性要求。...

存储网关

存储网关CSG(Cloud Storage Gateway)是款可以部署在用户本地数据中心和阿里云上的网关产品。它以阿里云对象存储OSS后端存储云上和云下应用提供业界标准的文件服务(NFS和SMB)和块存储服务(iSCSI)。云存储网关 目前提供两种...

高效基因序列检索助力快速分析肺炎病毒

在氨基酸序列中定义词 生物信息学中用K-mers来分析氨基酸序列,k-mer是指将核酸序列分成包含k个碱基的字符串,即从一段连续的核酸序列中迭代选取长度K个碱基的序列,若核酸序列长度L,k-mer长度K,那么可以得到L-K+1个k-mers。...

AimeRead

example.&filter_rule=score%3E1.0&.score>1.0,过滤score值大于1.0的doc.&filter_rule=score%3E1.0%20and%20city%3D%27hangzhou%27&.score>1.0 and city='hangzhou',过滤score值大于1.0,并且city“hangzhou”的doc.&filter_rule=score...

快速开始

本文将介绍如何快速上手使用向量检索服务DashVector。前提条件 已创建Cluster:创建Cluster。已获得API-KEY:API-KEY管理。已安装最新版SDK:安装DashVector SDK。说明 需要使用您的api-key替换示例中的YOUR_API_KEY、您的Cluster Endpoint...

基于向量检索服务与TextEmbedding实现语义搜索

什么是 Embedding 简单来说,Embedding是一个多维向量的表示数组,通常由系列数字组成。Embedding可以用来表示任何数据,例如文本、音频、图片、视频等等,通过Embedding我们可以编码各种类型的非结构化数据,转化具有语义信息的多维...

名词解释

字段类型 每字段所属的类型(数值、浮点、字符串等等)向量字段 存储向量的字段,字段类型多值FLOAT 需要embedding字段 存储需要被embedding的字段(比如文本、或者base64的图片),字段类型STRING或TEXT 多值分隔符 默认使用ha3分割...

通过控制台使用宽表模型

重要 全局二级索引的第一列主键可根据需要选择任意主键列或者预定义列,本地二级索引的第一列主键必须和数据表的第一列主键相同。全局二级索引以异步方式将数据表中被索引的列和主键列的数据自动同步到索引表中,正常情况下同步延迟达到...

向量检索

向量检索介绍 为了满足更多元化、更复杂的业务场景,开放搜索推出向量检索功能,在特定的业务场景下(特别是教育搜题场景、图片搜索场景),可以结合多路搜索功能...向量索引的长度限制编码前4K,一般一个query里面最多支持查询2个向量索引

时序模型介绍

通过时序模型,您可以对时间序列进行存储、查询和分析。时序模型提供了数据生命周期、时间线索引、冷热存储、数据压缩等功能以满足时序数据的低成本存储以及高性能查询分析的需求。时序模型在车联网场景中主要用于车辆轨迹数据的存储、查询...

时序模型介绍

基于物联网场景中多源异构数据存储、高并发吞吐、海量数据高性价比存储、多维度数据处理与分析等需求,表格存储推出了站式物联网存储IoTstore解决方案,物联网设备元数据、消息数据、时序轨迹等海量数据提供存储、查询、检索、分析、...

UpsertCollectionDataAsync-异步上传向量数据

说明 文件内容格式 jsonl,即每行是一个特定格式的 json 数据,代表向量数据。单行的数据结构 {String Id;Map,Object>Metadata;List<Double>Vector},如 {"Id":"myid","Metadata":{"my_meta_key":"my_meta_value"},"Vector":[1....

生命周期管理概述

全部数据存储在低频存储或归档存储节省的存储费用(费用A)读写低频存储或归档存储中的数据产生的流量费用(费用B)(通用型NAS存储单价-低频存储单价或归档存储)×预估存储容量 文件存储NAS的存储单价,请参见 文件存储NAS产品定价。...

数据存储需求评估

阿里云存储服务不同的存储场景提供存储优化方案,并没有一个通用的方案能够适用于所有的存储场景。因此,当您在评估存储需求时,请考虑对不同的业务负载分别选择不同的存储方案。您在每业务负载中划分数据并确定存储需求时,需要考虑...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
对象存储 文件存储NAS 云存储网关 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用