用Python和gma库搞定气象干旱分析：从Excel表格到空间栅格的SPI计算全流程-编程阁

Python与gma库实战：气象干旱空间分析技术手册

干旱监测是气候研究中的基础课题，而标准化降水指数（SPI）作为世界气象组织推荐的干旱评估指标，其计算过程从单站数据扩展到空间栅格分析时，会面临多维数据处理、计算轴设定、结果可视化等一系列技术挑战。本文将完整演示如何利用Python生态中的gma地理气象分析库，构建从Excel表格到GeoTIFF栅格的端到端SPI分析流水线。

1. 环境配置与数据准备

在开始SPI计算前，需要确保Python环境已安装关键科学计算库。推荐使用Miniconda创建专属环境：

conda create -n climate python=3.8 conda activate climate pip install gma numpy pandas rasterio matplotlib

典型的气象数据来源有两种形式：

站点数据：通常以Excel/CSV存储，包含时间序列的降水记录
栅格数据：GeoTIFF格式的多波段文件，每个波段代表特定时间段的空间降水分布

表：两种数据源的特征对比

特征	站点数据	栅格数据
维度	一维时间序列	三维（时间×行×列）
存储	Excel/CSV	GeoTIFF
处理工具	pandas	numpy/rasterio
计算复杂度	低	中等
空间代表性	单点	区域连续分布

对于科研级分析，建议从国家气候中心或NASA Giovanni获取基准数据集。以河南省为例，可下载CHIRPS降水数据集，使用QGIS裁剪出研究区域并保存为多波段GeoTIFF。

2. 单站SPI计算实战

从最简单的Excel数据处理开始，假设我们已有洛阳站1981-2020年的月降水数据（PRE_ET0.xlsx），核心计算流程如下：

import gma import pandas as pd from matplotlib import pyplot as plt # 数据读取与预处理 data = pd.read_excel('PRE_ET0.xlsx') precip = data['PRE'].values # 多时间尺度SPI计算 time_scales = [1, 3, 6, 12, 24, 60] spi_results = {f'SPI{ts}': gma.climet.SPI(precip, Scale=ts) for ts in time_scales} # 结果可视化 plt.figure(figsize=(12, 6)) for label, spi in spi_results.items(): plt.plot(spi, label=label) plt.axhline(y=-1.5, color='r', linestyle='--') # 干旱阈值线 plt.title('Monthly SPI Values at Luoyang Station') plt.legend() plt.grid()

关键提示：SPI1反映当月干旱状况，SPI12则表征年际变化。农业干旱关注SPI3-6，水文干旱需看SPI12-24。

计算结果保存时，建议采用HDF5格式保留完整元数据：

import h5py with h5py.File('spi_results.h5', 'w') as f: for ts in time_scales: f.create_dataset(f'spi_{ts}', data=spi_results[f'SPI{ts}']) f.attrs['station'] = 'Luoyang' f.attrs['time_period'] = '1981-2020'

3. 栅格SPI计算核心技术

空间化的SPI分析需要处理三维数组（时间×纬度×经度），gma库的Axis参数成为关键控制点。以下演示处理多波段GeoTIFF的完整流程：

import numpy as np from osgeo import gdal # 读取栅格数据 precip_set = gma.Open('PRE_Luoyang_1981-2020.tif') precip_data = precip_set.ToArray() precip_data[precip_data == precip_set.NoData] = np.nan # 三维数组SPI计算（沿时间轴） spi_grids = { scale: gma.climet.SPI(precip_data, Axis=0, Scale=scale) for scale in [1, 3, 6, 12, 24, 60] } # 空间可视化（以SPI12为例） def plot_spatial_spi(spi_grid, timestamp): plt.imshow(spi_grid, cmap='RdYlBu', vmin=-3, vmax=3) plt.colorbar(label='SPI Value') plt.title(f'SPI12 Spatial Distribution {timestamp}') plot_spatial_spi(spi_grids[12][-1], 'Dec 2020')

栅格数据处理时需要特别注意：

缺失值处理：将NoData转为numpy.nan
内存管理：大区域计算时建议分块处理
坐标系统一：确保所有输入输出文件投影一致

表：栅格SPI计算常见问题排查

问题现象	可能原因	解决方案
计算结果全为NaN	输入数据包含无效值	检查NoData设置
维度不匹配错误	Axis参数设置错误	确认数据维度顺序
内存溢出	数据量过大	使用分块计算或升级内存
空间错位	投影不一致	统一所有数据CRS

4. 结果分析与应用场景

不同时间尺度的SPI结果具有明确的应用指向：

SPI1-3：适用于农业干旱预警，反映土壤墒情变化
SPI6-12：用于水库调度和水资源管理
SPI24+：研究气候变迁与长期干旱趋势

将计算结果与遥感干旱指数（如VCI、TVDI）叠加分析，可构建综合干旱监测系统。以下代码演示如何计算干旱频率：

# 计算中旱以上发生频率 drought_threshold = -1.5 spi12 = spi_grids[12] drought_freq = np.sum(spi12 < drought_threshold, axis=0) / spi12.shape[0] # 输出干旱频率图 gma.rasp.WriteRaster('drought_freq.tif', drought_freq, Projection=precip_set.Projection, Transform=precip_set.GeoTransform)

对于业务化运行系统，建议构建自动化处理链：