OBSWriter提供了向OBS写入类CSV格式的一个或者多个表文件。
写入OBS内容存放的是一张逻辑意义上的二维表,例如CSV格式的文本信息。
OBSWriter实现了从DataX协议转为OBS中的TXT文件功能,OBS本身是无结构化数据存储,OBSWriter需要在如下几个方面增加:
支持且仅支持写入 TXT的文件,且要求TXT中shema为一张二维表。
支持类CSV格式文件,自定义分隔符。
暂时不支持文本压缩。
支持多线程写入,每个线程写入不同子文件。
文件支持滚动,当文件大于某个size值或者行数值,文件需要切换。 [暂不支持]
我们不能做到:
{
"job": {
"setting": {},
"content": [
{
"reader": {
},
"writer": {
"name": "obswriter",
"parameter": {
"endpoint": "https://obs.cn-north-4.myhuaweicloud.com",
"accessKey": "yourAccessKey",
"secretKey": "yourSecretKey",
"bucket": "yourBucket",
"object": "obstest/datax",
"writeMode": "truncate|append|nonConflict",
"fieldDelimiter": ",",
"encoding": "UTF-8"
}
}
}
]
}
}
endpoint
描述:OBS Server的EndPoint地址,例如https://obs.cn-north-4.myhuaweicloud.com。
必选:是
默认值:无
accessKey
描述:OBS的accessKey
必选:是
默认值:无
secretKey
描述:OBS的secretKey
必选:是
默认值:无
bucket
描述:OBS的bucket
必选:是
默认值:无
object
描述:OBSWriter写入的文件名,OBS使用文件名模拟目录的实现。
使用"object": "datax",写入object以datax开头,后缀添加随机字符串。 使用"object": "obstest/datax",写入的object以obstest/datax开头,后缀随机添加字符串,/作为OBS模拟目录的分隔符。
必选:是
默认值:无
writeMode
描述:OBSWriter写入前数据清理处理:
必选:是
默认值:无
fieldDelimiter
描述:读取的字段分隔符
必选:否
默认值:,
encoding
描述:写出文件的编码配置。
必选:否
默认值:utf-8
encrypt
描述:是否在服务器端进行加密存储。
必选:否
默认值:false
OBS本身不提供数据类型,该类型是DataX OBSWriter定义:
DataX 内部类型 | OBS 数据类型 |
---|---|
Long | Long |
Double | Double |
String | String |
Boolean | Boolean |
Date | Date |
其中:
略
略
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。