Skip to content

Latest commit

 

History

History
92 lines (63 loc) · 2.45 KB

odpswriter.md

File metadata and controls

92 lines (63 loc) · 2.45 KB

ODPS写入插件(odpswriter)

1. 配置样例

{
    "job": {
        "setting": {},
        "content": [{
            "reader": {},
            "writer": {
                "name": "odpswriter",
                "parameter": {
                    "odpsConfig": {
                        "accessId": "${odps.accessId}",
                        "accessKey": "${odps.accessKey}",
                        "project": "${odps.project}"
                    },
                    "table": "tableTest",
                    "partition": "pt='xx'",
                    "writeMode": "append",
                    "bufferSize": 64,
                    "column": [{
                        "name": "col1",
                        "type": "string"
                    }]
                }
            }
        }]
    }
}

2. 参数说明

  • accessId

    • 描述:ODPS系统登录ID
    • 必选:是
    • 默认值:无
  • accessKey

    • 描述:ODPS系统登录Key
    • 必选:是
    • 默认值:无
  • project

    • 描述:读取数据表所在的 ODPS 项目名称(大小写不敏感)

    • 必选:是

    • 默认值:无

  • table

    • 描述:读取数据表的表名称(大小写不敏感)

    • 必选:是

    • 默认值:无

  • partition

    • 描述:需要写入数据表的分区信息,必须指定到最后一级分区。把数据写入一个三级分区表,必须配置到最后一级分区,例如pt=20150101/type=1/biz=2。

    • 必选:如果是分区表,该选项必填,如果非分区表,该选项不可填写。

    • 默认值:空

  • column

    • 描述:需要导入的字段列表,当导入全部字段时,可以配置为"column": ["*"], 当需要插入部分odps列填写部分列,例如"column": ["id", "name"]。ODPSWriter支持列筛选、列换序,例如表有a,b,c三个字段,用户只同步c,b两个字段。可以配置成["c","b"], 在导入过程中,字段a自动补空,设置为null。
    • 必选:否
    • 默认值:无
  • writeMode

    • 描述:写入模式,支持append和overwrite

    • 必填:否

    • 默认值:append

  • bufferSize

    • 描述:写入缓存大小,单位兆,odps写入数据时会先缓存,达到一定值后才会写入数据,如果写入数据时出现内存溢出,可以降低此参数的值。

    • 必填:否

    • 默认值:64