程序员生活网-www.ryxx.com
& ''''()
* ++,
*+ ''''
*+, ''','--
*.指定 *,可以有多个,以空格分隔;( 可以同时监
控 多个目录中的文件)
&.配置检查点文件的路径,检查点文件会以 ) 格式保存已经 文件的
位置,解决了断点不能续传的缺陷。
*/*01:配置每个 * 的文件绝对路径,文件名可以
用正则表达式匹配
通过以上配置,就可以监控文件内容的增加和文件的增加。产生和所配置的文件名正
则表达式不匹配的文件,则不会被 。
1.2. HDFS sink 文件滚动属性
基于文件闲置时间策略
配置项:hdfs.idleTimeout
默认值:0
说明:默认启动这个功能
这种策略很简单,如果文件在 hdfs.idleTimeout 秒的时间里都是闲置的,没有任何数
据写入,那么当前文件关闭,滚动到下一个文件。
基于 hdfs 文件副本数
配置项:hdfs.minBlockReplicas
默认值:和 hdfs 的副本数一致
原理:
hdfs.minBlockReplicas 是为了让 flume 感知不到 hdfs 的块复制,这样滚动方式配置
(比如时间间隔、文件大小、events 数量等)才不会受影响。
假如 hdfs 的副本为 3.那么配置的滚动时间为 10 秒,那么在第二秒的时候,flume
检测到 hdfs 在复制块,那么这时候 flume 就会滚动,这样导致 flume 的滚动方式受到
影响。所以通常 hdfs.minBlockReplicas 配置为 1,就检测不到副本的复制了。但是
程序员生活网-www.ryxx.com
评论0
最新资源