3.1 KiB
3.1 KiB
| 字段名称 | 字段类型 | 中文说明 | 注释 | 是否为主键 |
|---|---|---|---|---|
| year_month | varchar(7) NOT NULL | 账期,格式 YYYY-MM | 账期,格式 YYYY-MM | 是 |
| data_type | integer NOT NULL | 数据来源类型 | 数据来源类型 | 是 |
| building_id | varchar(64) NOT NULL | 楼宇 ID | 楼宇 ID | 是 |
| cellkey | varchar(64) NOT NULL | 小区唯一键 cellkey | 小区唯一键 cellkey | 是 |
| cell_name | varchar(128) | 小区名称(冗余) | 小区名称(冗余) | 否 |
| operator_name | varchar(32) NOT NULL | 运营商名称 | 运营商名称 | 是 |
| network_class | varchar(32) NOT NULL | 网络制式 | 网络制式 | 是 |
| freq | varchar(32) NOT NULL DEFAULT 'all' | 频段 | 频段 | 是 |
| indoor_flag | smallint NOT NULL DEFAULT -1 | 室内外标识 | 室内外标识 | 是 |
| provincecode | integer NOT NULL | 省编码 | 省编码 | 否 |
| citycode | integer NOT NULL | 地市编码 | 地市编码 | 否 |
| districtcode | integer NOT NULL | 区县编码 | 区县编码 | 否 |
| cell_lon | numeric(10, 6) | 小区经度 | 小区经度 | 否 |
| cell_lat | numeric(10, 6) | 小区纬度 | 小区纬度 | 否 |
| cell_wkt | text | 小区点 WKT | 小区点 WKT | 否 |
| cell_geom | geometry(Point, 4326) | 小区点几何列(由 cell_wkt 或经纬度生成) | 小区点几何列(由 cell_wkt 或经纬度生成) | 否 |
| updated_time | timestamp without time zone NOT NULL DEFAULT now() | 记录更新时间 | 记录更新时间 | 否 |
计算逻辑说明
- 实现侧:HiveSQL
- 数据源:
td_building_grid_m *(同步自 PG) + 压缩后的 MR ODS。 - 计算限制:仅处理电信(telecom)运营商数据。
- 计算逻辑:
- ODS MR 压缩:按
year_month,data_type,operator_name,network_class,freq,indoor_flag,regionid,cellkey执行GROUP BY并对rsrpcount求和。 - 关联与权重计算:通过
regionid关联楼宇,汇总电信小区对楼宇的rsrpcount贡献度。 - 主服务判定与过滤:利用
rsrpcount作为权重过滤噪声小区(如保留贡献占比前 80% 的小区)。 - 结果应用:同步至 PostGIS 供业务层查询展示。
- ODS MR 压缩:按
- 字段全量映射清单:
目标字段 来源表 & 字段 转换逻辑/备注 year_monthODS (MR): year_month直接映射 data_typeODS (MR): data_type直接映射 building_idtd_building_grid_m *桥接获得 cellkeyODS (MR): cellkey直接映射 cell_nametd_cell_param_m #:cell_name关联回填 operator_nameODS (MR): operator_name仅保留 'telecom' network_classODS (MR): network_class直接映射 freqODS (MR): freq直接映射 indoor_flagODS (MR): indoor_flag继承属性 (统一为 0:室外, 1:室内) provincecodetd_building_grid_m *归属回填 citycodetd_building_grid_m *归属回填 districtcodetd_building_grid_m *归属回填 cell_lon/lattd_cell_param_m #关联回填 cell_wkt/geomtd_cell_param_m #关联回填 updated_time- 系统当前时间 now()