o HñhÐã@sjUddlmZddlZddlmmZddlmZddlm Z gZ eee d<ejjGdd„dƒƒZdS)é)ÚOptionalN)ÚTensor)Ú2_scripted_functional_optimizer_deprecation_warningÚ__all__c@s~eZdZ ddeeded ed ededed ededededededefdd„Zdeeefdd„Z dS)Ú_FunctionalAdagradç{®Gáz„?ççð?ç»½×Ùß|Û=TFÚparamsÚlrÚlr_decayÚweight_decayÚinitial_accumulator_valueÚwarmup_lr_multiplierÚwarmup_num_itersÚepsÚ coalesce_gradÚforeachÚfusedÚmaximizeÚ_allow_empty_param_listcCs²tdd|||||||dœ|_| |_| |_||_||_tj t tj t ttj ffi¡|_t |ƒdkr:| s:tdƒ‚d|i|_|jdD]}t |j|¡t d¡dœ|j|<qDdS) Né)Ú stacklevel)rr rrrrrrz%optimizer got an empty parameter listrr)ÚsumÚstep)rÚdefaultsrrrrÚtorchÚjitÚannotateÚdictrÚstrÚstateÚlenÚ ValueErrorÚparam_groupÚ full_likeÚdataÚtensor)Úselfrrr rrrrrrrrrrÚp©r+ú^/var/www/vscode/kcb/lib/python3.10/site-packages/torch/distributed/optim/functional_adagrad.pyÚ__init__s, ù $ þÿz_FunctionalAdagrad.__init__Ú gradientscCs@|jd}g}g}g}g}t|ƒt|ƒkr(tddt|ƒ›ddt|ƒ›ƒ‚d\}}t|jd|ƒD]1\} } | dure|| jO}|t | ¡O}| | ¡| | ¡|j| }| |d¡| |d¡q4t ¡,t j|||||jd |jd |jd|jd||j |j||jddd WdƒdS1s™wYdS)NrzEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: )FFrrrrr r)rrr rÚhas_sparse_gradrrÚhas_complexrÚ grad_scaleÚ found_inf)r%r#r$ÚzipÚ is_sparserÚ is_complexÚappendr"Úno_gradÚFÚadagradrrrr)r)r.rÚparams_with_gradÚgradsÚ state_sumsÚstate_stepsr/r0ÚparamÚgradientr"r+r+r,rIsV ÿþÿ € ñ"ÿz_FunctionalAdagrad.stepN)rrrrr rr TFFFF) Ú__name__Ú __module__Ú__qualname__ÚlistrÚfloatÚboolr-rrr+r+r+r,rsRòþýüûúùø ÷ öõô ó ò/r)ÚtypingrrÚtorch.optim._functionalÚoptimÚ_functionalr8rÚ,torch.distributed.optim._deprecation_warningrrrCr!Ú__annotations__rÚscriptrr+r+r+r,Ús