Druid知识点及踩坑总结

Obelia ·

更新时间:2024-11-14

· 557 次阅读

1. Druid中的intervals参数


  "spec" : {
    "ioConfig" : {
      "type" : "hadoop",
      "inputSpec" : {
        "type" : "granularity",
        "dataGranularity" : "DAY",
        "inputPath" : "/HDFS路径",
        "filePattern" : ".*",
        "pathFormat" : "'dt='yyyyMMdd'/id_type=${id_type}'"
      }
    },
    "dataSchema" : {
      "dataSource" : "da_wanxiang_tag_analysis__metric",
      "granularitySpec" : {
        "type" : "uniform",
        "segmentGranularity" : "DAY",
        "queryGranularity" : "DAY",
        "intervals" : ["${sday}T00:00:00.000+08:00/${eday}T00:00:00.000+08:00"]
      },
      "parser" : {
        "type" : "hadoopyString",
        "parseSpec" : {
          "format" : "tsv",
          "delimiter" : "\u0001",
          "timestampSpec" : {
            "format" : "yyyy-MM-dd HH:mm:ss",
            "column" : "dt_time"
          }
        }
      },
    },
GranularitySpec中的intervals参数，指定过滤的时间范围，有两个用途：
一是对于ioConfig里的inputPath下的pathFormat的dt=yyyyMMdd，指定了分区日期，为${sday}。
二是对于输入路径下的所有数据，有一个timeStamp列，这一列存储了每一行数据对应的时间戳，不符合intervals范围的时间戳对应的行会被丢弃。
例如：指定了分区日期为dt=2020-02-16，但是输入路径的文件数据中，时间戳列全是2020-01-16，会报错

报错信息如下：

上面显示已经读取了输入路径下的分区数据，但是下面又报错No buckets? seems there is no data to index
报错原因在于找不到符合intervals的行
也就是说，intervals指定的dt=2020-02-16这个分区下的文件虽然被读取到了，但是时间戳列都是2020-01-16，所以没有符合过滤条件的数据，也即没有data能够进入Druid的segment中，所以会报以上错误。
2. Druid中的hadoop数据源的粒度
粒度有两种，查询粒度queryGranularity和存储粒度segmentGranularity。
区别是，存储粒度的粒度更细，比如存储粒度为hour，查询粒度可以是hour和day
但是如果存储粒度是day，查询粒度就不能是hour了。
3. Druid中inputSpec参数
若type指定为static，为明确指定输入路径，路径指定到文件夹。
若type指定为granularity，则需要在输入路径目录中，指定日期格式，如上面所示。


参考文档：druid上传数据index文件配置


作者：攻城狮Kevin
                    
 
                

                            druid


           
    
    

            
                
                    
                
            
            
                
    
        
            需要 登录 后方可回复, 如果你还没有账号请 注册新账号
        
    
                
            
                
                    
                        相关文章

    
        
            24个canvas基础知识小结
        
        
            Novia
            2020-10-11
        
    
    
        541
    


    
        
            关于数据库连接池Druid使用说明
        
        
            Kathy
            2021-05-26
        
    
    
        579
    


    
        
            druid数据源连接mysql（8.0版本以上）,报错Cannot resolve com.mysq.jdbc.Connection.ping method.  Will use 'SELECT 1'
        
        
            Rosalia
            2021-02-17
        
    
    
        935
    


    
        
    
    
        
            OLAP红与黑 | 也许你应该考虑一下Druid
        
        
            Orianna
            2021-02-04
        
    
    
        831
    


    
        
    
    
        
            Druid 0.17 入门（2）—— 安装与部署
        
        
            Jenna
            2020-04-16
        
    
    
        689
    


    
        
    
    
        
            数仓即席查询--Druid
        
        
            Nova
            2021-08-04
        
    
    
        515
    


    
        
    
    
        
            Druid知识点及踩坑总结
        
        
            Obelia
            2021-02-16
        
    
    
        557
    


    
        
    
    
        
            SpringBoot使用druid数据源整合mybatis(配置文件版)并实现增删改查（源码）（一个简单的例子）(没有使用逆向工程)
        
        
            Ophelia
            2020-01-14
        
    
    
        798
    


    
        
            Druid SQL解析器的解析过程
        
        
            Fredrica
            2021-01-22
        
    
    
        565
    


    
        
    
    
        
            提取Druid的SQL解析器
        
        
            Rochelle
            2020-06-23
        
    
    
        738
    


    
        
            MyBatis使用Druid数据源批量更新失败
        
        
            Julie
            2020-10-23
        
    
    
        611
    


    
        
    
    
        
            通过Spring的IOC控制完成druid数据库的基本操作案例
        
        
            Bonita
            2020-08-06
        
    
    
        655
    


    
        
    
    
        
            【Spring Boot自学笔记四】整合MyBatis+Druid+使用MyBatis Generator+动态扫描开发
        
        
            Bella
            2020-04-24
        
    
    
        560
    


    
        
            SpringBoot在yml配置文件中配置druid的操作
        
        
            Onida
            2021-06-07
        
    
    
        584
    


    
        
            低版本Druid连接池+MySQL驱动8.0导致线程阻塞、性能受限
        
        
            Hana
            2021-12-16
        
    
    
        1639
    


    
        
    
    
        
            MySQL 8.0 驱动与阿里druid版本兼容问题解决
        
        
            Rabia
            2021-12-16
        
    
    
        1621
    


    
        
    
    
        
            SpringBoot详解如何进行整合Druid数据源
        
        
            Mercia
            2022-06-25
        
    
    
        777
    


    
        
    
    
        
            springboot整合mybatisplus与druid详情
        
        
            Hana
            2022-09-28
        
    
    
        1779
    


    
        
    
    
        
            数据库连接池Druid与Hikari对比详解
        
        
            Mathilda
            2023-02-04
        
    
    
        50
    


    
        
    
    
        
            SpringBoot使用druid配置多数据源问题
        
        
            Oria
            2023-03-13
        
    
    
        1831


        
    
        
            我要提问
        
    
    
        
        
    
        致谢
        
            帮助他人，成就自己。
            人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。
            1024问感谢每一位朋友的帮助和支持。
            软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。
        
    
    
        
            
    育儿网
    微养生
    全球行
    美食街
    育儿
    菜谱大全
    海南旅游
    女性
    养狗百科
    星座