统计建模论文范文一:
地震动是非常复杂且具有很强随机性的随机过程,其主要特性可以由幅值、持时和频谱三个基本要素来描述[1?2]。其中,地震动的频谱特性是指地震动对不同自振周期的结构反应特性的影响,在工程抗震中通常用傅里叶谱和功率谱来表示。地震动功率谱用来表征地震动的能量在各频段内分布的相对关系,可以进一步清晰地描述地面运动能量的频域分布规律,是地震动模型的重要组成部分[3?5]。对于功率谱模型的研究,最早是Housner[2]在1947年提出的平稳白噪声功率谱模型,后来Kanai[6]将平稳白噪声过程经过一个阻尼比和圆频率分别为ξg和ωg的单自由度体系过滤后得到绝对加速度的功率谱,但是Kanai?Tajimi谱严重高估了地震动的低频含量。作为地震学和地震工程学的重要内容之一,对功率谱模型的研究在过去的几十年内取得了令人瞩目的进展,多种改进模型被提出,如:C?P谱[7]、胡聿贤?周锡元谱[8]、欧进萍谱[9]、杜修力谱[10]和洪峰谱[11]等,这些功率谱模型基本上都是对Kanai?Tajimi谱的修正。
在随机地震反应分析中,一般采用功率谱密度函数表征地震地面运动,目前最大的难点就是地震动功率谱模型及其参数的确定。所采用的功率谱模型是否合理,参数是否准确,这将直接决定分析结果的可信度。在各类功率谱模型中,Clough等[7]提出的C?P谱利用了两个线性滤波器,可以过滤掉超低频率处的激励,从而改善了Kanai?Tajimi谱不能反映基岩地震动的频谱特征以及过分夸大低频能量的缺点,具有明确的物理意义。但是,由于C?P谱的参数较多且物理关系较为复杂,这在一定程度上限制了该模型的工程应用。因此,研究C?P谱模型的参数识别方法及参数统计规律,对该模型在工程抗震中的广泛应用具有重要意义。
对于C?P谱模型参数识别的研究,田利等[12?13]根据《电力设施抗震设计规范》(GB 50260—2013),采用普通最小二乘(Ordinary Least Square,OLS)算法对模型参数的取值进行了分析。柳国环等[14]、彭凌云等[15]均采用OLS算法对功率谱模型参数进行识别。但是,OLS算法对模型参数初始值的选取以及原始功率谱曲线的非线性要求高,这显然给大数据批处理统计分析制造了巨大的困难。为更加准确地保留原始功率谱的特性,寻求一种广泛适应性和快速收敛性的智能优化识别算法尤为重要。随着计算机技术的快速发展,越来越多的智能优化算法被应用于复杂的计算中,如遗传算法(GA)、蚁群算法(ACA)、粒子群优化算法(PSO)等,其中PSO算法具有群体智能、内在并行性、迭代格式简单、可以快速收敛到最优解所在区域等优点,被广泛应用于函数优化、神经网络训练和模糊控制系统等领域。
在地震工程中进行结构动力时程分析时,需要选择合适的地震记录。《建筑抗震设计规范》(GB 50011—2010)[16]规定:采用时程分析法时,应按建筑场地类别和设计地震分组选用实际强震记录和人工模拟的加速度时程曲线,其中实际强震记录的数量不应小于总数的2/3。与真实地震记录相比,人工合成地震动能更有代表性地反映地震动的统计特征,并满足结构抗震设计需求,因此研究科学合理且高精度的人工地震动合成方法具有重要意义。
为解决上述问题,本文采用自适应加权粒子群优化(AWPSO)算法,对Clough?Penzien谱模型的参数进行识别,然后从地震动数据库中挑选4159条地震记录并按照《建筑抗震设计规范》(GB 50011—2010)中的场地分类标准将其分组,采用AWPSO算法对C?P谱模型进行参数识别,并依据K?S检验、A?D检验及AIC准则和BIC准则确定参数的最优概率分布模型。依据各参数间的相关性,建立Clough?Penzien谱模型参数的联合概率密度函数。以Ⅱ类场地为例,对比分析规范场地转化功率谱与统计抽样功率谱的谱型差异,利用功率谱迭代修正的人工地震动合成方法,生成具有场地特性的地震记录,为地震危险性、易损性和风险评估以及工程结构抗震设计和评估等提供可靠的地震动输入。
1 Clough?Penzien功率谱模型参数及识别方法
1.1 Clough?Penzien功率谱模型及参数
Kanai?Tajimi谱假定基岩地震加速度为白噪声,不能反映基岩地震动的频谱特征,且存在夸大地震动低频含量、不能求出地震地面位移、速度以及加速度的有限方差等缺点。Clough等[7]提出的C?P谱模型,其优点是利用两个线性滤波器,过滤掉超低频率处的激励,改善了Kanai?Tajimi模型[6]过分夸大低频能量的情况,从而得到修正的模型如下:
S(ω)=ω4g+4ξ2gω2gω2(ω2g?ω2)2+4ξ2gω2gω2? ω4(ω2f?ω2)2+4ξ2fω2fω2?S0
(1)
式中 ωg和ξg分别为场地的卓越圆频率和阻尼比;ωf和ξf分别为第二过滤层的卓越圆频率和阻尼比;ω
为圆频率;S0为谱密度。
C?P谱模型的随机参数向量θ为:
θ=[ωg ξg ωf ξf S0]
(2)
对于上述5个参数的取值,目前学者们仅仅指出了ωf的取值应该小于ωg,建议ωf的取值范围为0.1~0.15倍的ωg,ξf可以取与ξg相同的值,并没有依据真实地震记录给出场地可供参考的取值范围。
刘章军等[17]依据建筑抗震设计规范反应谱,给出了不同场地各参数的建议取值,但对于ωf的取值采用0.1倍的ωg,ξf取与ξg相同的值,一方面由于第二个过滤层的参数设置的固定化,忽视了由于场地的随机性与复杂性所导致的功率谱模型参数的不确定性;另一方面由于规范反应谱对各类场地的5倍特征周期以上的谱值已经进行了人为的放大,使谱值在不同周期段的概率特性、精度和协调性不一致,进而导致了规范反应谱并不能准确反映真实地震记录的时频特性。因此基于真实地震记录对随机参数向量θ进行精确识别和统计,给出不同场地各参数的取值范围,对工程抗震设计和评定具有重要意义。
1.2 基于自适应加权PSO算法的参数识别
洪峰等[11]将Kanai?Tajimi谱模型非线性函数化,然后利用OLS算法确定参数,并给出了软土、中等土两类场地的参数识别结果。孔辰等[18]基于日本KiK?net强震数据库,采用上述方法对杜修力?陈厚群功率谱[10]进行了四类场地的参数识别。在对大量原始地震记录功率谱进行参数识别时,由于OLS算法对数据的非线性以及拟合参数初始值的设置要求较高,一般预先对原始数据进行平滑化处理,以达到准确的识别结果。鄂国康等[19]利用移动平均算法对原始地震记录功率谱进行平滑化处理,然后采用OLS算法确定功率谱模型参数。彭凌云等[15]也采用了类似的方法对不同功率谱模型进行参数识别,但移动平均算法有两大缺陷:一方面,平滑处理后的功率谱谱值与真实谱值之间存在一定的误差;另一方面,由于没有考虑结构的自振频率,无法实现不同频率区间采用不同窗口大小的功能。
目前研究人员可以利用不同的谱窗以及数字滤波器技术实现对功率谱的平滑化,无论何种方法,都是削峰填谷,使整体变得平滑,产生偏差是在所难免的。原始地震记录由于受到震源特性、传播路径和场地条件的影响,功率谱在频率上呈现出显著的多峰性、非平稳性和随机性的锯齿状,平滑处理后仅大致反映地震能量的平缓分布,消除了大量的随机性特征,保留了频谱的主体特性。因此,基于预平滑处理后和采用OLS算法进行参数识别的误差平方和分别可以表示如下:
???????????????????εsmooth=∑i=1n[Sreal(ωi)?Ssmooth(θ,ωi)]2εOLS=∑i=1n[Ssmooth(θ,ωi)?SOLS(θ,ωi)]2εtotal?OLS =εsmooth+εOLS
(3)
式中 Sreal(ω)为原始地震记录的功率谱函数;Ssmooth(θ,ω)为经过平滑处理后的功率谱函数;SOLS(θ,ω)为OLS算法参数识别后的功率谱函数模型。
OLS算法的目标是寻找一组随机参数向量θ(ωg ξg ωf ξf S0),使得观测值与理论值的残差平方和εtotal?OLS达到最小值。可以看到,采用传统OLS算法进行参数识别存在两部分误差:一个是由平滑化处理引起的误差平方和εsmooth,另一个是OLS算法参数识别产生的误差平方和εOLS。由此可见,两项误差源必定会导致总误差偏大,从而影响函数模型参数识别的准确性。
当前,越来越多的智能优化算法被应用于复杂工程问题的求解中,其中PSO算法的应用最为广泛,它通过设计一种无质量的粒子来模拟鸟群中的鸟,粒子仅具有两个属性:速度和位置,速度代表移动的快慢,位置代表移动的方向,粒子分别通过以下两个公式来更新自己的速度和位置:
νi,d(t+1)=λνi,d(t)+c1r1[pbesti,d(t)?xi,d(t)]+ c2r2[gbesti,d(t)?xi,d(t)]
(4)
xi,d(t+1)=xi,d(t)+νi,d(t+1), i=1,…,d
(5)
式中 νi,d(t)为粒子i在第t次迭代的速度;xi,d(t)为粒子i在第t次迭代中的当前位置;pbesti,d(t)为粒子i的个体极值点的位置;gbesti,d(t)为整个种群的全局极值点的位置;r1,r2为[0,1]之间的随机数;c1,c2为正的学习因子(加速系数);d为维数;λ为惯性权重系数。
每个粒子在搜索空间中单独搜寻最优解,并将其记为当前个体极值,并将个体极值与整个粒子群里的其他粒子共享,找到最优的那个个体极值作为整个粒子群的当前全局最优解,粒子群中的所有粒子根据自己找到的当前个体极值和整个粒子群共享的当前全局最优解来调整自己的速度和位置,其中粒子更新的方法如图1所示。
统计建模论文范文参考二:
相对于震源机制等地震学因素和“震源-传播途径-局部场地”的物理模型,工程上更加关注地震动本身的工程特性。演变功率谱模型从地震动的幅值、持时、频谱等工程特性出发,是地震工程中应用最广泛的随机地震动模型。一般来说,演变功率谱模型由强度调制函数和平稳功率谱两部分组成,强度调制函数对平稳信号进行调幅;平稳功率谱描述局部场地作用在白噪声过程下的能量分布规律。在确定了演变功率谱模型之后,便可用谐波合成法[1]模拟地震动加速度过程。 目前演变功率谱的常用参数是根据规范反应谱拟合得到的确定性取值,这虽然便于工程应用,但是忽略了地震震级、传播途径、场地条件等因素的不确定性,从而忽略了演变功率谱参数显著的随机性。这将导致生成的地震动样本过于规则,且工程特性单一,不能反映地震动丰富的概率信息和细部概率结构。
对于参数取值的确定性研究,已有较多学者以抗震规范为基础,取得了较为完善的成果[2-5]。对于参数的随机性建模,丁艳琼等[6]基于工程随机地震动物理模型,对7 000条地震动进行了精细的分组与参数识别,并对其进行了统计建模;李杰等[7]同样基于工程随机地震动物理模型,对5 000条地震动进行了参数识别与统计建模。虽然随机性参数与功率谱的概念似有矛盾,但却更符合工程上对地震动认知与应用。
为了体现震级、距离以及场地因素对地震动造成的影响,本文对实测强震记录进行了精细的分组。利用最小二乘法,识别演变功率谱的模型参数;并结合拟合优度检验和贝叶斯信息准则,确定每个参数的最优概率模型;最后引入随机函数约束[8-10],仅用6个随机变量便可实现地震动过程在概率层面上的模拟。由于地震动代表性时程具有赋得概率,可进而与概率密度演化理论相结合[11-12],对结构进行精细的动力响应和可靠度分析。
1 地震动工程随机模型及人工合成方法
根据文献[13],非平稳地震动过程的演变功率谱密度函数可表示为:
SUg(ω,t;λUg)=f(t;λf)2S(ω;λS) (1)
式中:SUg(ω,t;λUg)为非平稳地震动加速度过程Ug(t)的单边演变功率谱;f(t;λf)为强度调制函数;S(ω;λS)为单边功率谱。
对于强度调制函数,采用工程上常用的Amin-Ang模型[14]。该模型优点是可以较为全面地刻画地震动的波形;缺点是采用了分段形式,形式复杂且无法准确地反映地震动峰值到达时刻[15]。
式中:t1、t2和c分别代表非平稳地震动过程的平稳段起始时间、平稳段结束时间和衰减段的衰减速度。因此,Amin-Ang模型的参数向量可表示为λf=(t1,t2,c)。
对于单边功率谱,采用工程上常用的Kanai-Tajimi模型[16]。该模型优点是从动力学角度推导,参数具有明确的物理意义;缺点是S(0;λS)≠0,不符合实际情况:
式中:ωg和ξg分别为场地土的卓越圆频率和阻尼比;S0为白噪声激励的强度,可表示为[17]:
式中:Amax表示地震动峰值加速度;r为峰值因子;ωe为S0=1时S(ω;λS)与坐标轴围成的面积。因此,Kanai-Tajimi模型的参数向量可以表示为λS=(ωg,ξg,r)。
这样,演变功率谱密度函数的参数向量λUg便可表示为:
λUg=(λf λS)=(t1,t2,c,ωg,ξg,r) (5)
确定演变功率谱密度函数SUg(ω,t;λUg)之后,便可采用谐波合成法生成地震动过程。根据文献[10],非平稳地震动过程的源谱表达为:
式中:Δω为频率步长;Δω=ωu/N;N为截断项数;ωk=k×Δω(k=1,2,…,N);ωu为截断频率。
式(6)中,Xk,Yk为一组零均值的标准正交随机向量,满足以下基本条件:
E[Xk]=E[Yk]=0,E[XjYk]=0
E[XjXk]=E[YjYk]=δjk (7)
式中:E[·]为数学期望;δjk为Kronecker-delta记号。
传统的谐波合成法在本质上属于Monte Carlo方法:一方面,生成的样本数量巨大,极大地增加了结构动力反应分析的计算量;另一方面,Monte Carlo方法在本质上属于随机抽样方法,所生成的样本概率信息不完备,无法进行结构精细化动力反应分析和动力可靠性评价。为克服传统Monte Carlo方法的上述挑战,本文引入了随机函数的降维思想[8-10],将标准正交随机变量集{Xk,Yk}(k=1,2,…,N)定义为基本随机向量的正交函数形式:
2 实测强震记录
本文从太平洋地震动工程研究中心(PEER)NGA-West2地震动数据库中筛选了1 766条主轴方向的实测强震记录,且严格遵循以下原则挑选:
(1) 断层距离应大于10 km,以减少近断层地震动的数量。
(2) 实测记录的矩震级应大于5,以排除对结构影响较小的地震动。
在筛选的实测强震记录中,Rjb(Joyner-Boore距离)范围为0~540 km;vS30(地下30 m平均剪切波速)范围为106.83~1 525.85 m/s;M(矩震级)范围为:5.0~7.9。
《中国地震动参数区划图》[18]中建议了Ⅰ0~Ⅳ五种场地类别。本文结合文献[9],根据每条实测强震记录的vS30对实测强震记录进行分类。同时,为了进一步体现震级与距离因素对地震动工程特性造成的影响,本文以M和Rjb为指标,采用K均值聚类的方法,将每个场地的实测强震记录另分为3组,可概括为:远场大震、近场小震和近场大震[6]。由于小震无法传播到较远的距离,因此没有远场小震这一项。
Ⅱ类场地的聚类结果如图1所示。可以看出,聚类方法的分组结果与《建筑抗震设计规范(GB 50011—2010)》[19]中的地震分组有着相似性。
表1给出了不同聚类分组和场地对应的实测强震记录数量:
此外,实测强震记录还需要四阶Butterworth滤波处理以及1%~99%范围的能量截取,以保证研究结果的可靠性[20]。
图2和图3分别给出了不同场地的反应谱均值对比图和Ⅱ类场地不同分组的反应谱均值对比图。需要说明的是,为了对比清晰,将实测强震记录均调幅至0.2g·m/s2。由图2可知,随着场地土变软,反应谱峰值逐渐向长周期移动,且长周期成分也逐渐增多。由图3可知,不同分组的反应谱峰值和长周期成分有着显著差异,充分证明了震级和距离对地震动工程特性的显著影响。
3 演变功率谱参数识别
对于第i条实测记录ai(t),其随时间变化的归一化能量曲线Ii(t)可表示为[21]:
式中:Ti为第i条实测强震记录的持时。
对于非平稳地震动过程,其随时间变化的归一化模型能量曲线P(t)为:
以Ii(t)为目标值,采用最佳平方逼近原则,便可识别ai(t)的参数向量λf,i:
根据帕萨瓦尔定理,信号在时域上的能量与频域上的能量相等,可以得到:
令
于是:
同时结合式(3)和式(4)得:
由于ai(t)的峰值加速度Amax,i是已知的,将参数向量λf,i代入式(14)中便可得到Ei,再根据式(15b)便可得到与ai(t)对应的峰值因子ri。
对于平稳地震动功率谱的场地参数,采用拟合反应谱的方法识别。为简便起见,在对场地参数进行识别时,将地震动视为等效平稳过程。Vanmarcke将随机过程的反应谱定义为单质点体系反应峰值系数的平均值与反应方差的乘积[22],因此,地震动反应谱与功率谱转换公式可以定义为:
式中:(ω0;λf,i)为等效平稳过程的峰值因子;σ(ω0,ξ;λS,i)为等效平稳过程的反应方差。ω0与ξ分别为结构的固有圆频率和阻尼比,在本文中ω0≥1.05 rad/s,ξ=0.05;Td,i为等效平稳过程的持续时间,即为强度超过峰值50%的持续时间,对于Amin-Ang模型,Td,i的表达式为:
以ai(t)前6 s反应谱αi(ω0)为目标值,根据式(16),采用最佳平方逼近原则,对参数向量λS,i进行识别:
这样,便完成了与ai(t)对应的演变功率谱参数向量λUg,i的识别。类似地,可依次识别1 766组实测强震记录的参数向量λUg,i。
以SFERN地震为典型实例,根据式(11)与式(16),反应谱和地震动归一化能量的结果见图4(a)
与图4(b),可以看出,模型与实测记录均拟合良好,验证了本文采用的识别方法的有效性。参数识别结果如表2所列。
4 演变功率谱参数统计建模
为了体现演变功率谱参数的随机性,本文选取了5种备选概率模型对每个参数的概率分布进行拟合。这5种备选概率模型分别为:对数正态分布(LOGN)、耿贝尔分布(GUM)、广义极值分布(GEV)、韦布尔分布(WEI)、伽马分布(GAM),它们的概率密度函数如表3所列。
以Ⅱ类场地的参数ωg为例,概率分布拟合结果如图5。可以看出,难以直接判断ωg的最优概率模型。
为此,本文引入了K-S检验。一般来说,当K-S检验为0时,表示接受该备选概率模型;为1时,表示拒绝该备选概率模型。进一步地,当有多个备选概率模型通过K-S检验时,则根据贝叶斯信息准则进一步筛选。贝叶斯信息准则可表示为[24]:
BIC=ln(n)u-2ln(L) (21)
式中:u为概率模型中参数的个数;L为模型最大似然函数;n为样本容量。一般地,BIC值越小,代表模型拟合度越好。
结合K-S检验与BIC信息准则,每个演变功率谱参数的最优概率模型以及对应的模型参数如表4所列。
在表4中,当概率模型为LOGN时,Par1为均值,Par2为标准差;概率模型为GUM时,Par1为位置参数,Par2为形状参数;概率模型为GEV时,Par1为形状参数,Par2为尺度参数,Par3为位置参数;概率模型为WEI时,Par1为比例参数,Par2为形状参数;概率模型为GAM时,Par1形状参数,Par2为尺度参数。
为了更清晰地表现参数随场地变化的趋势,图6展示了每个参数均值不同场地的变化趋势图。
图6(a)可知,随着土质变软,场地土卓越圆频率逐渐变小;而峰值因子和场地土阻尼比没有明显的变化。对于场地土阻尼比,文献[6]指出,阻尼比不仅与场地土的软硬有关,还与其厚薄、孔隙率、形状、体积等因素有关。因此不能通过简单的场地类别与分组反映其影响的强弱。对于峰值因子,文献[3]指出,峰值因子对场地变化不敏感。
图6(b)可知,随着土质的变弱,地震动的平稳段起始时间和地震动衰减因子逐渐缩小,而地震动的平稳段持续时间逐渐延长。这说明随着土质的变弱,地震动的总持时逐渐延长。
综上,建议将场地土阻尼比和峰值因子近似做均值处理,而其他参数做随机变量处理。
5 数值算例
5.1 降维模拟的实现
由前文可知,模拟地震动共需要6个随机变量{t1,t2,c,ωg,Xk,Yk}。且根据式(8),Xk,Yk均是同一个基本随机变量的函数形式。这样,模拟地震动过程共需要5个基本随机变量。
式中:l=1,…,nsel;F-1ωg、F-1t1、F-1t2及F-1c分别代表任意分组下ωg、t1、t2及c最优累计分布函数的反函数。这样,便得到了具有随机性的演变功率谱模型参数。
式中:l=1,…,nsel。
这样,便得到了地震动过程的基本随机变量集Θ={Θ1,Θ2,Θ3,Θ4,Θ5},将基本随机变量Θ1~Θ4,场地土阻尼比均值和峰值因子均值代入式(1)中,便可得到非平稳地震动的演变功率谱模型SUg(ω,t;λUg);将基本随机变量Θ5代入式(8)中,得到随机变量{Xk,Yk}。再根据式(6),便可模拟地震动样本。
* 请认真填写需求信息,我们会在24小时内与您取得联系。