o Hñh2ã@sjUddlmZddlZddlmmZddlmZddlm Z gZ eee d<ejjGdd„dƒƒZdS)é)ÚOptionalN)ÚTensor)Ú2_scripted_functional_optimizer_deprecation_warningÚ__all__c@s‚eZdZ ddeededededed ed ededed efdd„Zdedeefdd„Z deeefdd„Z dS)Ú_FunctionalSGDç{®Gáz„?çFÚparamsÚlrÚmomentumÚ dampeningÚweight_decayÚnesterovÚmaximizeÚforeachÚfusedÚ_allow_empty_param_listcCs|tdd||||dœ|_||_||_||_| |_tj t tj t ttj ffi¡|_t |ƒdkr7| s7tdƒ‚d|i|_dS)Né)Ú stacklevel)r rrr rz%optimizer got an empty parameter listr )rÚdefaultsrrrrÚtorchÚjitÚannotateÚdictrÚstrÚstateÚlenÚ ValueErrorÚparam_group)Úselfr r rrr rrrrr©r úZ/var/www/vscode/kcb/lib/python3.10/site-packages/torch/distributed/optim/functional_sgd.pyÚ__init__s ü$z_FunctionalSGD.__init__ÚparamÚgradc Cs|jd}|jd}|jd}|jd}|g}g}g} d} |durK| |¡|jr+d} ||jvr5i|j|<|j|}d|vrD| d¡n| |d¡t ¡tj|| ||||||j|j | |j |jddd Wdƒn1sqwY|j|}|d }|dur‰||d<dSdS)z[Similar to self.step, but operates on a single parameter and its gradient. r rrr FNTÚmomentum_buffer©r rr rrrÚhas_sparse_gradrrÚ grad_scaleÚ found_infr)rÚappendÚ is_sparserrÚno_gradÚFÚsgdrrrr) rr#r$r rrr r Úmomentum_buffer_listÚgradsr'rr%r r r!Ú step_param;sR òÿ ÿz_FunctionalSGD.step_paramÚ gradientscCs€|jd}g}g}g}|jd}|jd}|jd}|jd} t|ƒt|ƒkr:tddt|ƒ›dd t|ƒ›ƒ‚d } t||ƒD]7\}}|durx| |¡| |¡|jrXd} ||jvrbi|j|<|j|} d| vrq| d¡qA| | d¡qAt ¡t j||||||| |j|j | |j|jddd Wdƒn1sŸwYt|ƒD]\}}|j|} ||}|dur½|| d<q¨dS)Nr r r rrzEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: FTr%r&)rrrrÚzipr*r+rrr,r-r.rrrrÚ enumerate)rr2r Úparams_with_gradr0r/r r rrr'r#ÚgradientrÚiÚpr%r r r!Ústepmsn ÿþÿ € òÿ €üz_FunctionalSGD.stepN) rrrrFFFFF)Ú__name__Ú __module__Ú__qualname__ÚlistrÚfloatÚboolr"rr1r9r r r r!rsBõþýüûúùø ÷ ö õ!2r)ÚtypingrrÚtorch.optim._functionalÚoptimÚ_functionalr-rÚ,torch.distributed.optim._deprecation_warningrrr=rÚ__annotations__rÚscriptrr r r r!Ús