42
Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU George Stantchev, William Dorland, Nail Gumerov PII: S0743-7315(08)00094-4 DOI: 10.1016/j.jpdc.2008.05.009 Reference: YJPDC 2543 To appear in: Journal of Parallel and Distributed Computing Received date: 12 March 2008 Accepted date: 10 May 2008 Please cite this article as: G. Stantchev, W. Dorland, N. Gumerov, Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU, Journal of Parallel and Distributed Computing (2008), doi:10.1016/j.jpdc.2008.05.009 This is a PDF file of an unedited manuscript that has been accepted for publication. As a service to our customers we are providing this early version of the manuscript. The manuscript will undergo copyediting, typesetting, and review of the resulting proof before it is published in its final form. Please note that during the production process errors may be discovered which could affect the content, and all legal disclaimers that apply to the journal pertain.

Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

Accepted Manuscript

Fast parallel particle-to-grid interpolation for plasma PIC Simulationson the GPU

George Stantchev, William Dorland, Nail Gumerov

PII: S0743-7315(08)00094-4DOI: 10.1016/j.jpdc.2008.05.009Reference: YJPDC 2543

To appear in: Journal of Parallel and Distributed Computing

Received date: 12 March 2008Accepted date: 10 May 2008

Please cite this article as: G. Stantchev, W. Dorland, N. Gumerov, Fast parallel particle-to-gridinterpolation for plasma PIC Simulations on the GPU, Journal of Parallel and DistributedComputing (2008), doi:10.1016/j.jpdc.2008.05.009

This is a PDF file of an unedited manuscript that has been accepted for publication. As aservice to our customers we are providing this early version of the manuscript. The manuscriptwill undergo copyediting, typesetting, and review of the resulting proof before it is published inits final form. Please note that during the production process errors may be discovered whichcould affect the content, and all legal disclaimers that apply to the journal pertain.

Page 2: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

��������������� ������������� ������������������ !�"#�����$%�&���'�(���&"

�)�*+�,������- � �.!(/ 0�� - 12���3�����&"2�4�&" ��56� �7�98

:<;>=�?A@B;%C�DFE�G�DIHKJ�;MLONAPRQTSVUXWXWYUZE�[ \<=�?]WZE�G(^#N`_<E�UYW�:2a([b;c?]=dL*e

fKg�hjicklhnmponq msr>tjuvhnickwu x�tygzq {}|>~�kwu�iI�y� i>�����`k��Khj{��Akwuwt�� ����q��]hj��u�iI�

�A� iM��kwuwkw~Kklh�ojq m��}� � � i>t�h��)gzq {}|>~�klhnm�rckw~M� u�hn�� iMu�� hjm���u�kw��qZo����`m�� ��� i>�

�����j�����M `�

¡B¢ £¥¤¥¦¨§j©¨ªn«l¦¨¬K«X­®ª�©¨©}¯w¡�°¥­�±³²�ªj¤¥´MµF¶M·�´M¢�¸`ª�¹dªjª�¬�º»¦¼¶�ª�©�½#¾M·¿ª�¶�À�µ`£sÁ>©¨¢`·¥²�¢yÁ>´]½K·¥¦¨§j·�·¥¦¨²Â¾M©¨¢�«¤¥¦�µA¬c·p¦¨¬'¤¥´�ª»Ác¢`·¥¤�¤¥´�£¥ªjª�¶�ª�§j¢`¶�ª�·jÃKÄŵ�ª�¬M·¥¾�£�ª»¢`¬3¢`§j§nªjÁc¤¥¢ ¹c©�ªÆ©�ªj¸`ª�©Mµ`ÀÇ·¿¤¥¢ ¤¥¦¼·¿¤¥¦¨§j¢`©È¢`§j§j¾�£�¢`§n½£¥ª�©¼¢ ¤¥¦�¸`ª�©�½s©¨¢ £�É`ª�¬F¾M²�¹dªj£�µ`À>Ác¢ £¥¤¥¦¨§j©¨ª�·T¢ £¥ª�¬Mªjª�¶�ª�¶�ÃAÊF¤¥¢ ¤¿ªn«vµ`À¼«v¤¥´Mªn«l¢ £¥¤�Ë�£�¢ Ác´M¦¨§j·B¡�£�µF§nª�·¥·�¦¨¬�ÉÌ�¬M¦�¤¥·s¯v˳¡pÌ�·�±�ÍMº»¦�¤¥´�¤¥´Mª�¦�£»´M¦�ÉA´y²�ª�²�µ`£¥½�¹c¢`¬M¶�º»¦¼¶�¤¥´�ÍK´I¾M¬c¶�£¥ª�¶M·�µ`À�ÊK¡�Î*ÏÐÁM£¥µK§nª�·¥·¿µ`£�·jÍ¢`¬M¶�´M¢`©�ÀÑ«l¢�«v¤¿ªj£�¢ ÒMµ`Á�Ádªj£¥À�µ`£�²�¢`¬c§nªÂÁdµ`¤¿ª�¬I¤¥¦¨¢`©�Íǵ Ódªj£s¢y¸K¦¨¢ ¹c©¨ª�¢`©�¤¿ªj£�¬M¢ ¤¥¦�¸`ª�¤¿µÔ¶M¦¨·¿¤¿£�¦�¹c¾�¤¿ª�¶²�ª�²�µ`£¥½#Ác¢ £�¢`©¨©�ª�©p§nµA²�Ác¾�¤¿ªj£�·sÀѵ`£Â£�¾M¬c¬M¦¨¬�É�²�ª�¶M¦¨¾c²Õ«l·¥§j¢`©�ª'¡p°¿­ÖÁc©¨¢`·¥²'¢y·¥¦¨²Â¾M©¨¢ ¤¥¦�µA¬M·×µA¬¦¨¬MªnØFÁdª�¬M·¥¦¨¸`ª®§nµA²�²�µF¶M¦¨¤l½Õ´M¢ £�¶�º�¢ £¥ª`ÃA°Z¬Õ¤¥´M¦¨·BÁc¢ Ádªj£�Í`º®ª�ÁM£�ª�·¿ª�¬]¤�¢`¬�µ�¸`ªj£¥¸K¦�ªjºÙµ`Àd¢³¤Y½IÁc¦¼§j¢`©Ác©¼¢`·¥²�¢y¡�°¥­Ö§nµK¶�ª'¢`¬c¶�¶M¦¨·�§j¾M·¥·³¦�¤¥·�˳¡pÌÚ¦¨²�Á>©�ª�²�ª�¬I¤¥¢ ¤¥¦�µA¬�Ã�°Z¬)Ác¢ £¥¤¥¦¨§j¾c©¨¢ £×º®ª�ÀѵK§j¾M·sµA¬Àw¢`·¿¤�¢`©¨É`µ`£�¦�¤¥´M²�·×Àѵ`£�¤¥´�ª�Ádªj£¥À�µ`£�²�¢`¬M§nª�¹dµ`¤¿¤¥©�ª�¬Mª�§¥Û#µ`Ádªj£�¢ ¤¥¦�µA¬�µ`À�Ác¢ £�¤¥¦¨§j©�ªn«v¤¿µ «vÉ`£�¦¨¶Ü¦¨¬I¤¿ªj£¿«ÁdµA©¨¢ ¤¥¦�µA¬ÇÃ

Ý hj��Þpq m¿���nß Ë³¡pÌÖ­®µA²�Ác¾�¤¥¦¼¬�É�ÍcÊK§j¦�ª�¬I¤¥¦�àc§s­®µA²�Á>¾�¤¥¦¨¬�É�Í�¡B¢ £�¢`©¨©�ª�©�á�©�É`µ`£�¦¨¤¥´M²�·jÍâ�¾M²�ªj£�¦¼§j¢`©ÅÊK¦¨²Â¾M©¨¢ ¤¥¦�µA¬M·�ÍF¡B¢ £¥¤¥¦¨§j©¨ªn«v°X¬K«X­�ª�©¨©ÇÎãªj¤¥´MµF¶M·�Íc¡p©¨¢`·�²�¢�¡p´I½F·�¦¨§j·

ä ­�µ`£¥£¥ª�·¿ÁdµA¬M¶M¦¼¬�ÉÂá�¾�¤¥´�µ`£�Ã

åpæ�çZèdæ�é¨êÈëBì�íMî`ï'évë¿ëlç�ð&ëlñÕòpó¼ì�ç�ô�é�ç�æ õFö�÷�í`ê>çÆõFö`ö ø

Page 3: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

ù ú�ûTü`ýAþzÿ����Fü��lþÅû

������ ������������������������� ��!��"#$��% ���&�'�)(��&*,+������$�,-.�)� ��)(���*/%0���21!��� �+ ������3���4���5�'�76 �"8��*9��$�&�:�'������ ����/��"! ��&������ ��2;<���=$�>*�� ��=�&� $+����2������� ����#+;0?@�����&��ACBD������$�$�����@E���)���'�F��"#�2;9�� �% ��*/+9�� ������&�����HGI;� ���J���*��)6>��*�����' ��LK����5�'� ������M���*,�&� ���)���5�'�)6���NO��;��6>�)� + ��>*��&���P�5QR�&�&�'�P���4�SGI��*�� '����% �J��"C�����+�� ��������*,��+9���'�����O���T�������&A�U��)�';�� �% ;/��;�"8��*9��$�&�:�'���V+ �����&��+�)���J%��L6��� �����%W+������$�,*�?>�9������&��XY���$�&�)?[Z=�]\>GF�����_^`�a�&b:�9�]E�'�)� ��!���*c�d�2����������������������2;9������&��X:�� ��eGM�&���9f:���GI�YX0� N��'���������%3��;���) D��� �)���'�)� �g��*��� ��������)���'�)�!��������+��'�)� ������*h ����)�&6����0��+;0?>���������> ���%�������C�����i+ �� N�����j��"� �@�'���'���*�)�%��� �+���'���'�)� �9������� �+�)�5\@�)�k?�A

Bl�� d�'�)�����mEknk�@EpoM���)�V-.B!ndoP1e��&��;�@*��P ���+� ��������0��� ��a��"����56 �& '���#f:����5�'�)�a��++ ��0���2;�&�P�'�+������$�h���)�������'�)� �YA0qP;�&���r$�5�';�>*�&X@N9������*W� �/;:?>N ���*Ws#��% ����% �����@Ekt!������ ������c"8� pE�������'�)� �u��"�*�?>�9������&��XV�)�:6�� �)6��,"8� ���)��GI���%=��;�,�' ��LK����5�'� ����&�g��"�6>�) ��'����r-.$�� �f��� '1+9�� d�'���&���&�D���c�';�I��?>�d�'��v+;�����i��+9������A:Uw/��K�� D�2;9���)������% �e"8� HBDndox$�5�';�>*�!���V��;���;�&�� i/��% ��)���*�J��"���;�r�>���N��& I��"l+�� ��������)���P��&��*�&*y���c".���)�';@"8����7?$ ���+ ��������0����;���*�& ��7?@�)�%a+;0?>���)����X>�J�&� ����� '���)�0�D�';9���V;9���D;�)���'�� ����������7?r+���;��*/B!ndoz���+�)������0�2�]E�'�)� ��V�)�:���J�';�P ��T���){��"O*�)���� ���N����'�&*g$�&$� d?S���+O�� ��&� �+���'�)�%A |@�&6��� '���O ���*���&�'�)� ��'�&�2;���b:��&��XO$�����I����'��N�7?4%�?> ���E}f:����5�'���&��X;��6��S;�&��+O��*~ ��&���]\/�';�)�i�&� ��d�' '�����0�����*;9�T6 �/�����)�LGF��*<��@*��� '�]�'���7?[����(��&*YX#+;0?>�����������7?[��T�������%�"8���V���)�����]�'������3�'�~NO��+O�� pE"8� ����*W� �W��/���)���& e���������r+������"8� �$�&A

BDndo���&�';��@*�D��+��& '�����P� �g�';�i��������+��'�)� ���';���!���0�'�& '���5�'�)� ��!���� �%J+�� ��������)���!�� ���T�� � ��)��*4� ���P��; ����% ;4���)���5�' ���/��%���&�����3�9�&��*�&AU� ����&�����)������� M% ���*4�)�M�k?>+���������7?$������*�'�r� N��'�����c�a*�)���& ��&����(&��*� ���+� ��������0�2�]�'�����$��"O�';��e�9���)*�!�L6��� D�';��i���������������� �h*� $�����YA|@� �76@�)�%e�';��D�&6 ����������� �r��b:�9�]�'������C��">�';�V�9�&��*�C�)�C� ��!��">$�����a�&� $+O� ��&�0�'�C��"��IB!ndo���>*���O;��GF�&6 �& r�)�'�i�5\@�&��������� �[������h����������0�'�3"8� �� ��7?y�LE2�L������"D�';�h���)�����]�'�����Y^`�

Page 4: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

�'���'���#-���A`�J���&?>fy-d�T� �0� 1�15A qP;�I ���$������)�%J�'�)$�P�)�D��+O���0�F� �$�56 � �76>���%r+9�� d�'�)�����&�H���*�T���)��������'�)�%$��;�g+9�� d�'�)�����mE}�9�&��*[�)�0�'�� ����&����� ����XR�m\@+ ��&�����&*u����$+�@�2������� �9�����)?4���a���>�T������0�'�& �+O� ���]�'�����/� +O�� ����'�)� ���A@qP;�����r� +��& '������� ���e�� ��J�';�a$�LK�� F+��& �"8� �/�������JNO���������mE����2f���"#BDndo����>*�&��A�|>�' ����'�&% ���&�F�'�h� +��������(��IBDndo�+O�� �"8�� �$������i;9�T6 �3N��&���,�d�'�*�)��*���*����+���&$�&�0�'��*a�m\>�'�������)6����7?a"8� C���>*���� ���������%i���h���� �% �l���T�����!*���d�' ���N������*r���gE� �?4�� ��2;�7�'�&�&�'�� ����&A�qP;�����h".���)�Y/������7?/�)�W�kGF�/�����'�&% � ������&�9+9�� d�'���&���J*�������$+O� ���7�'�)� ����2;�&$�&�S"8� h� +��'�)/���V���0��*�N9��������&���%y���*u+�� ��������)�c��� d�'����%y"8� ����+ ���6>����%[oeB!��T���2;��S����;�� �����&�W-.�����h"8�� ��)����'������/-_�F�LGF�� ���XY��� ���L1mX�-.qP��f>;��f]��? �4���*[|@�2;��&��*�& �X��� �0��15X#-.B! �(��&N���*�$����*=oe�� �?OX���� �0� 1�15A

nk���+��� ��&*cN:?S�';�P�����'�&���V�� �����*�!���*c*�56 ���)� +����0�'�!�)�g% '��+�;���&�V+ ��>���&�������%a�'�&�2;�� ��E� %�?,GF�r���06 �&������%0�����a�';�a"8�T������N������7�k?/��"l�)$+�)������0�'�)�%gBDndow��&��;�>*�I� �4�';�S��B!��Ank��+9�� ��'�)������� gGM�~"8�@�&���� ��+9�� ��'�)���)�5E}����Ek%� ���*z�)�0�'�� �+������������ �������)���)�$�m\�+O���5�'�&*��'�*� ����9�]�'�g�';�$�5\@���&���'�)� �u+�)+��&���)��c���*����=NO�$��;�$�� �d�S�2;9�������&�% �)�%y�&� �+�� �����0����,���� ���e��"�+O�� d"8� �$����&�J� +��������(T�]�'�����YA ��;���)�3GF�a ����d�' ����&�e� � I�����'���0����� �,���cB!ndo���)�����]�'�������XTGF�e���+;9������(&�F��;9���l��;�M������F�k?>+��M��"9���>�T���>�)�0�'�� �+������������ ��������� ��� ��'��/���0?a���';�& l��+�+���)�T������� ���� ��T���M-.�����F"8�� ��)����'����&�J-_|@� ��&����&�g�&�l����A7X]��� ���01�1�GI;�& ����� �06��� ������ �yN��5�kGM�&���y���T�]���'�& ��&*@Ek+O� ���0�����*~���� ���5�'� ���*@E}% ��)*W*9���2���'��f��&��+��������A

�r�&��� �����BD� �+O� ���J�rB!��-_��BH�rB!�J1l����$+�@�'����%rGM���H+��������& ���*�����\g? ���� ��F��% �aGI�7�';�';�S��*�6����0�a��"D��;�h�9 ����3+ �� %� '���/��N���a% ���+;�)����+ ��>���&������ ���A�n}�J;9���3�5\@+O�� �����������*�~����% ���)�9�����0�rN��>� ���aGI�7�';�)���';�c+9���d�r? �T�� �X#��"����� a�';�c�)�:�� ��>*��5�'��������"e�I�Jnp�JnkUS^ �oM� �+���'�h�����)�9�&*=�J�56@�)���rU3 ��2;�)�����5�'� ��4-�oe���iUJ1P�����2;��� ��� %�? XGI;�)�2;=��Q��� ���*=������ ��7?u�y".�����'�& �XV$�������)6����7?�+9�� '���)�����!;9�� �*�GM�� ��4+�������"8� �~X#N���c���)�����&�;9����&��*�+ ���E% '��$����%4�&�06@�) �� ��$�&�:���S���*¡���@� �)�J"8� ������)���0�'�7�9����� �+���'���'�)� �YA#|@�)����/oe�3�IUS^ �+�N�)���J ����)�T�����J����&���&����"8�����)$+�)������0�2�]�'������H"8 �� v6��� �������P��++����������'�)� �,�� ��T���e;9�T6 ������ �% ��*�����*�;9�T6 ��*�&$������� '������*��';��[�&¢����)����5?£����*��';�y�' ��&$�&�*� ���,+��& �"8� pE/������r%0���)�4+����'���0�������R��;9���P��;�r��&G¤�� ��2;�7�'���5�'� ��r;9���P�'�c��Q��� &A

¥

Page 5: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

Ue�V�';��e�'����M������F�7�V;9���lN��&��� ��P��++�� ��&�:�l�';9���l���& ��2�����g�������������V��"R����% � ��)��;$���� ��N��5������ J����)����*��'�,+O�� d"8� �¦GF������� �[�';��c��B!����;9��������;�� ���AYqP;��g��+O�����7�9�g����� �?;���& '�� ��2;0? X�GI;������!NO����5�9�������:�'�J��� $�!�k?>+��&�V��"�� +O�� ����'�)� ��&X]+O� �����l�2;�����)���% �&�����3����;@E�� ����0"8� D�������2�������X �';� ���P�';9���H ����)?S� �� '���*�� {����� �?������&�����M���@QR�& H+O�� d"8� �$����&���� �����&�M�';9�]�e;9�T6 ���';�J+O�������0�'�����O���S�&�����������'�I���0���� ��&�)?c�';��3NO����5��'�P��"��rB!�h^ �M;�)% ;�';�&� ��5�'�)�T���>�'; �� �% ;+����TA U������X ���)% � ��)�';�$�CGI�)��;g����Gx�� ��7�';��&�����F���0�'�&����7�k?S ������]�'�)6���'�g�';����:�SN��& i��"l����� �?/� +O�� '�]�'������eGI���)�RNO��X9���W% �&��� �����X��������I�&¢����)���0�TA

§9� F�)����'����&��+������$�r����S���������� ���DN9�����&*,� �$�� ��)������� FZ=¨3����@*������!;9�T6��3��;��LGI��5\@���&���)���0�#� +��������(T�]�'������+O���'�&�0�'������� �a�';��H��B!�hX0-�|>�'���0�'�2;�56r�&�����_A)X���� � � 15X0-_�r��$�& ���6�&�r����A7XY�����0� 1i*�����'�/��;���) J�9����� '����"8� ��������'�)� �=�m\��&������)6����)?y���y�'�� �$�3��"H/���� ���\>E6 �&�&�'�� ���+��& '������� ��&ATB��� ��������)�V���)�������'�)� ��ON9�����&*h���a��� �+���'���'�)� �9�������' ����'�&% ���&�Y����;�� �';9���WB!ndo3X@����2;~���M$� �)���&����� H*�?>�9������&�a-_|>�'� ���J�&�I����A7X���� �0� 1mX�����*W�IEkNO�>*�?�% '�T60E�)�'���'�)� �9����*�?>�9������&��-_�I?@�����*YX��� �0��15X�;��6����������gN��&���W���+���&$�&�0�'��*/�&¢����)���0�'�7? Ank��';�&���,���������������� ��&XC+9�� d�'���&���&�h�)�:���� ����&�S���� �%y��;������&�)6����S6>���~��� ��%y ����% ��"8� ��&���GI;���2;/�� ��I�&�)�';��� D�T����������������*��5\����&���)?gN0?c���$�����%a�L6��� F������+�� �����)N���I+9�� d�'�)�����M+9���� ��� P��+�+ ��T\@��$���'�&*,6>���������)�2��N�������� ����&�I�� �����T������� �YA>qP;�$©5ªO«m¬�­]«m¬H;���% ;�& P�� ��)�';�$�5�'������0�'�&����7�k?~��"D�';�&������&��;�>*�3+ ���*�)�T�������i�';�h���� �% �h+O�� d"8� �$����&�S%0�����y���2;���56 �&*�����';�&�� P�)$+�)������0�2�]�'�����

Bl�� d�'�)�����mEkq���Ed�a ��)*,���0���� �+O� �����'�)� �YX>� �4�';�����';��� P;9����*YX9+��& �"8� �$�P����)?W��"8�5G®�� ��)�';>E$�5�'�)�h� +O�� ����'�)� ��i+��& 3*9�]�2�/+O� ���0�3���*YX�GI�)��;� ������@*�7�9�T�]�'�����YX9�5\@;�)N�)���3����� �?�����&�����i+�������� ����e�';9���i�� ��J�)�;�� ����0�'�7?, ����*� ~A@¨���GM�56 �& �X��&6����WGI�)�';4��;������©5ªO«5¬�­]«m¬*�&����)����X�B��� ��������)�5E}q���Ep�r ���*$���0�'�& �+O� ��������� �$�T���W�d�'���)�RNO�a���+���&$�&�0�'��*/�&¢����)���0�'�7?4� ��';�S�rBH��GI�7�';~+ �� +O�� i*9���'�g ��T�� � '���% ������0�3���*y����%�� ��7�';���*]K���d�'����0�TA�§9� I���>E���'�������X�|@� ��&����&�y�5������AY-���� ���01M;9�T6 �� ��&�����0���)?4*�&$������� '������*W6 �� d?W% �>�@*4��+��&��*�+".���&��� ��D"8� D��;���) M�rB!�£���+���&$�&�:�'���'�)� ����"O�';���% ���**����%a�d�'��+$��"R��;����� �@E}���7"8� �§V§lq¯-_��§V§lqi14����%�� ��7�';~XDGI;���2;°/����;��$�������T�����)?��)�4��*�&�0�'�������3���xB��� ������&���5E}q��]E

±

Page 6: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

�r ���*£�)�:���� �+�� �����'�)� �YA!nk�£�';���&� �0�'�m\@�~��"h��§V§lqaXe;��GF�&6��� �XP��;�<���&�W��"h���T�����'�& ���**9���'��+O� ���0���i�)�I���2�]�'���r���*y��;>���3�c+ ��&+ ��>���&�������%$*9���2�c ����� � ����% �&$�&�0���d�'�&+=��&��*��'�hN��i�5\@���&���'�&*W� ��)?�� �����A@nk�/��� �0�' �������X@�)�/BDndo������������'�)� ��D+9�� ��'�)���)���!�2;9���%��J+��]E���7�'������V"8 �� {� ��������P������+/���r��;�i��5\>�TX0��;>���M ��&b:��� ����%��r*�?>�9������I*9���'�r�d�' ���&��� ��� +��������(��&*�²5­]³8´W"8�� P�&¢����)���0�i�+�*���'�&�����*~".�����i$�&$�� �?/�����&�����&A

qP;���r+9��+��& a���a� �%0����)(���*����a"8� �)����GI�������¡|@�&�&�'�)� �¡�4GF�c% �)6������*<��6 �� d6>���&Gµ��"F��;���� � ��&�:�F�' ����*�M��"��rBF�rB!�w�&� �+���'�)�%A>|@�&�&����� � ¥ � �������)����!�';�i% �&��� ����RBDndo�����gE����]�'�����,"8 '����&GF� �f�AO|@�&�&����� � ± *��������������i�';��B��� ��������)�5E}q���Ep�r ���*,�)�0�'�� �+������������ �,��+@E�� ����'�)� �[����*�+�� �����)N���h���+���&$�&�:�'���'�)� �W���� '������% �)����AOnk��|@�&�&�'�)� �<��GF�g*�& ��)6��g�$".���d�+9�� ������)���!Bl�� ��'�)���)�5Ekq���Ep�r ���*����0���� �+O� �����'�)� ������% �� ��)��;¶�'�����)� ��&*<��+O�����7�9�T�����)?="8� ���;���B!��A�nk�~|@�&�&�'�)� �4·SGF�J+ ������&�0����� ��3��"C��;�roe�3�IU®���+�)������0�2������� �c*�5�2���)���M���**�����������+O�� d"8� �$����&�a ��&����7�'��A

¸ ¹gºO»Mý�º#�8»:¼ þ�½r¾,¿SÀÁ�Kþ�¡Ãl�züL�lû�Ä

�M� �)���'�& ��&*jN0?w����%���)�9�����0�=�)��� ��T�����¡�)�j+O�� d"8� �$����&������+9��N������7�'�)���4��6 �& y�';��¡+9���������\z? ���� ��/���*� ����&���0�,�)$+ ���6 ������0�����)�x+� �� % ����/��N������7�k? X#% ���+;�)���c+ ��>���&�������%���7�'�<-_��B!�J1,�� ��[�&�:���� ����%����0�����';��$���)����� ��T�� ��"���@*��� ������ �+�������%AFqP;���� � ��&�:�J;��% ;>Ek����*<��B!�Å���J�$+���GF�� �"8���l+9�� ������)���C+ ��@�&������� 3GI;�� ����"8����&�'�)� �9���)�)�k?4�)���c��� ��% �� F��� ������*W�'�g�';��J�' '��*�)����� �9���O%� '��+;������P+���+O�����)���A��rBH��^`�P;��6��r����d�2���)���*���+O�� pEdZy�>� ���^ �e���TG� '�]�'�J��"#+O�� d"8� �$����&�3�)��� ��T�����3"8� e������ ���M�S*�&�T��*�3���GrAqP;�+ ��)/�� �?4* ��)6��� ��3��"V�';����3+�;�����$�&�9����% ���GP�';=;9�T6 ��NO���&�=�';�S;��% ;��)?4+9�� '���)�����C��]E�'� ��[��"r% ���+;�)���$��� �+�������%XH���$GM�&���J���/� �*�� pEk����*��+O���*�����&��Xe+�)+��&���)����%�X!���*���� ��T��$�)�%X�����Y+9�� ��I��"��';�r% ���+;�)���I+ ��@�&���������%�+9�� ���*�)% yA

nk����**�)����� �RXR;�)% ;�*��$���*<"8 ���¶�';��c6>�)*���W%0�������%4���*�����' d?[;9����;�����+O��*�$�����@E

Page 7: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

�2���)�/ ������]�'�)6����7?c��� ��d�2���0�i�rB!�° ��&�2������+ ��)���&�MGI;���2;4;���MN �� �% ;0�F�';�J+O�� d"8� �$����&���� �d�S��"e����$+�@�'����%~*��LGI���'�~��+ ����&��*�&�:����*����56 �&����ACU��S�~ ��5"8�� ��&�����X���;�c+��& �"8� pE/������h��"D�';�h�'� +��I�Jnp�JnkUµ��� �[-��a�T§9� ��&��� ��� �/�i�)�' ��01i��B!���)�J��+�+ ��T\@��$���'�&�)?± �����r§Vs�ÆrBH|�XVGI;����2;x�� '���������]�'���c�)�:������N�� �@�$Ç@� A ± �0È �r§Vs�ÆaBF|O�V���������:�� '���d�$��;�+��& �"8� �/������g��"M� ¥ A`�y�r¨�(cnk�0�'�&�HoM� ��T�~�J���~oeBH�v���a�&��� �����'�y���~�r§Vs�ÆrBH|�XR� Ç ± È �r§Vs�ÆaBH|[-_�I�Jn2X������0� 15A@�����'�3��;9���e��;���e�)$+� ���6 �&*4+��& �"8� �/�������J�)�e���2;�)�&6���N�)�� ��7?,�)"��';���+� �� N�)��É/��+��eGM�&���Y�'�g��;�r��*�& ��)?>�)�%c+ ��>���&������ 3�� ��2;�)�����5�'� ���A

ÊB¦�É�Ã�Ë Ã�¡�ªj£¥Àѵ`£�²�¢`¬M§nª'§nµA²�Á>¢ £�¦¨·¿µA¬)¹dªj¤Yº�ªjª�¬2ËÆ¡pÌ�·s¢`¬c¶Ü­�¡pÌ�·×²�ª�¢`·�¾�£¥ª�¶�¦¼¬�ËeÊYÌRÍÆ¡�Ê¢`·�Ádª�¢ Û�¤¥´�£�µA¾�ÉA´�Ác¾�¤jÃFÏÆ¢ ¤¥¢ÕÁȵA¦¼¬]¤¥·®¶�ªj£�¦�¸`ª�¶3À�£¥µA²É`£�¢ Ác´M·�¦¨¬#¯wâHÎ�°�Í0ÏTÐ�Ð]Ñ`±�Í�¯vÊF¤¿µA¬�ª�ªj¤�¢`©�Ã�ÍÏTÐ�Ð]Ñ`±�Íd¢`¬M¶�¯�ÌT¾�ªj¹MÛ`ª`Í@ÏTÐ�Ð]Ñ`±

qP;�P*����% '��®� �c§l��%�A-p�L1���;��GI�!��;�e ���+��*S ������M�)���';�MÒ�0���'�)�%�E}+�� �)�0��+O�� d"8� �$����&���"S��B!�i�4���4����$+9�� ���*����u�';�=���)���7E}��� ��ynk�0�'�&��oeB!����AP��B!�Ó����� �?x���)(��[�)��������[% ��LGI�)�%Xl����NO���7�S�� ��/������GI�7? X�GI�7�';u�&� � ����0��% ������ '�]�'��������B!�i�g��QR�& ��)�%[�+�'�~� AÔ�$�r�w��"DÕIUaZ¡A9Ue��+ ��&���&�:��XY�rB!���i���+�+�� d�inptHt!t£���)�% �)�5Ek+� ����&������� �,Ò9� ���'�)�%+������0�J�� ��)��;��&�'�)��X9N�@�J*� ��N����+ ��&���)�������=����++��� ��a�)���m\�+O���5�'�&*�� ���i�3np�JnkU{�2;�)+�N0?4�';�r���&��� ��*y;9���)"���"D��� � ��A

��;���)�=��������"8� ��&$�&�0�'�������*�"8�����'�� ����,�� ��y��*� ��N��'�&*�)?������� '���5�'�)6���XH� ��[+�� ��������>E���� ~����+��&�&�=��"���@*��� �����B!�i�y;9���=+ ��L6���*��& ���&�����r�)�°�&�;9����&���%x�';�&�� W���+9���5�� �~�����)���0�'�7�9�a����$+�@�'����%AqP;�r���0�� ��>*��&����� �W��"l�i�3np�JnkUS^ ��oM� $+����'�������)�9�&*y�J�mE

·

Page 8: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

6>�����<U� ��2;�7�'���5�'� ��x-�oe�3�IUa1,;9���W��� �����*j��B!���4"8 �� �������'�& ��)����+O���������7E}+� �+�� �������E}+ ��>���&����� ��a�)�:���4;��%�;�)?~���&���&�����)N����XY+ �� % '��$��� I"8 ��)���*�7? X�+9�� '�������&�#���+O�� ���� gE+������ ��g"8� h�';�W����������� pEk�)�&6 �&�e*�&��f0�'� +RADU3�c����2;�oe�3�IUÖ;9���g��;�4+����'���0�������H�'�× *�&$�>�� ����'�)(���Ø3+9�� '�������&���&� $+����'�)�%a���*cN ����%a;���% ;@E}+��& �"8� �/������F+9�� '��*��% ��l�)�0�'��';�r$���������' ��T��Ù-_sC��&Nf���XR��� �0� 1mA

oe�3�IUz���+�+�� d�'�C�';��D������% ���mEk+ �� % '��yXm���7�'�)+���mEk*9���'�3-_|�BHZ=�r1R+ �� % '��$����%F$�>*�&��XGI;���2;~���M��� � ����0���)?4� ���a��"���;�a*� �������0�P+9�� ������)���O+ ��>���&�����)�%�+9�� '��*��% ���A�oe�3�IU�����)��GI�!��B!��+ �� % ���$���'�rN��eGI ��)���'���c�)��U3�J|@nloj-�GI�)��;$�3"8�5G��m\@���������� ���215X: ����';�& �';9���°% ���+;�)���pEk� ������0����*�������% �9��% ��Xe���)f���oM%x� ~��s�|�sDXe��;9���4GF�� ��¡*������% ����*�"8� ��;9��*���%h���)% � ��7�';���A�qP;�3�&� � ����0�Ioe���iUw*�)���' ���N�@�'������+� ���6>��*�&�M�esCUJ|$���*/§V§lq���)N '�� ����&��*������)% ��&*��'�u�2��f�����*@6����:�'��% �y��"a�';�=;9�� �*@Ge�� ���^ �4��&GÚ����+9��N�)���7�'���&��ADnk���**�7�'�)� �YXF6��� ���� ���W����% �� ��)��;gEk� ������0����*��)��N ��� ��)���4�� ��<��*�& ~*��&6 �&��� +�$�&�:��XI$� �d�����'��N�)?4��;�coe���iU{�a���2�$Bl�� ������)���#BD ��)$�7�'�)6����S-�oe���aBHBH1I����N� '�� d?�-_¨��� � ����3�5�a���_A)X��� �0��15A

|@�������~oe�3�IUS^ �c��¢��������M�)�:�� ��>*��5�'�����z���z�T�� ��)?z��� �0�>Xl�:���� �����c�����)���0�'�7�9�W��++����7E�T������� ���$"8 ��� �� ��T���,���,*�76 �� ����<���/+;0?@�����&��Xe�:���� ����T���J���)% ��N ���X!��� �+���'���'�)� �9���N������� %�?�X����*4/�]�';�&/�����������O��9����&��X;9�T6���NO���&�W���+���&$�&�:����*4���*4�'���d�'�&*y� �,��;���&G��� ��2;��)�'�&�&��� ���A:|@+O����*��+�".���&�'�� ��D��"O�+g�'�a���&6��� '���O;:���* ��&*$;9�T6��iNO���&�c����'�&*c������ �+9�� ������ �[GI�)��;[�';�g �����+O���5�'�76 ������ ������VoeB!�v�)$+���������0�'���'�)� ��S-_sC���N�f���X������0� 15AqeGM�r$������".���&��� ������&������a��Q����5�D$�����l��;�I���&�����)�� ����'�)� �S+O���'�&�0�'�����>"8� l�3% �76 ���c��+@E+���)�T������� �R�0�� ��7�';��&�����I���0��������)�k?�+��& F����� d?c� +��& '������� �� '�]�'���h���*$�';��+ ��56��������������"J ����*��Û$�&$� d?z���&���&���,+9�]���'�& ���&A!nk��% �&��� �����X!��+�+���)�T������� ���GI;����2;�+O�� d"8� �/���:?z�� ��7�';��&�����,� +O�� ����'�)� ��gNO�&�kGF���&��$�&$�� �?u ��T��*9È]GI ��7�'���&XH���*�GI;���2;x$�)��7E$�)(��!�';�M�>���N��& l��"� ����E}��"�Ek�� �*�& ������ �?��������&��������X �����*����3+O�� d"8� �¤NO������A�qP;�&����kGM��".���&��� ��H�� ��I����H����&�����'�� ����)?c�����b:��I�'�hoe�3�IUwN���!�';�&�� !���+9���5�!���&����H���h% �5�*����+ ���+�� d�'�)� �9�������)?/���+���7�9��*/N:?4��;���� ��2;��)�'�&�&��� ���^`�i��+O���&�)�9�r;9�� �*�GM�� ��a"8�T�]�'� �����A

Page 9: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

���!GI���)� ����������'�&$+��#����% �����0?a"8� d�';�& ��)�0�'�I�';�H*�&�'�����)�C��"�oe���iUh^`��;9�� �*�GM�� ��M���*����"��kGM�� ��M��@*�&���&A�tl\@���&���)���0�V�)�:�� ��>*��5�'�������X� ��&6>���5GI��X ���*h�����'� ������)�#;9�T6 �eNO���&��+ ��mE���&�:����*W���)���5GI;�� ��a���/+� ����0����*W���HGM�&���Y���e���$���)�������*���J"8� �¶-.�5"pAY-.sC���Nf���XO�����0� 15X-_�I�Jn2X0��� �0� 1mX-.¨iGI�c���*cÜa�) �f�X ��� �0� 1mX-_|>�'� ���e�&�!����A7X �����0� 15X�-�Æ3GF����D�5�!���_A)X���� � � 1�15A¨���GF�&6 �& �X#"8� a�';�c����f�����"F��� �+���5�'�&�������GF�$�)����)�*�c�W���)$+�)�)�9�&*=6 �& ������ �¡��"F��;��kGM�SN9�����)��*�����% �����V�';9���F���)����d�' ����'�ioe���iUh^`�F�5\@���&���'�)� �,+9�����'�& ���J-_§l�)%A>�-.N91�1!���*$�&$�� �?g;�)�� ��� ��2;0?=-_§l�)%A>�-.�01�1!���H+ ��&�����0����*4���/�i�3np�JnkUS^ �Poe�3�IU°B! �� % ���$�����%�r����*��XC-_�I�Jn2X���� �0� 1mA@�¡�r�������g+�� �)�0�e� ���P��;9���eGI;������3���';�& i��B!�j+�������"8� ����X>����2;���Dnp�PZ¡^ �MoM��������*c���)����I ��&���&�:���)?gUJZ=��^ �!§l�� ���|>�� ��T��yX��T���cNO�I�'��f��&�$�)�0�'�a��������)*@E�� ����'�)� �YX�� � J*������&�������� �=���3N�����&*���+O�����7�9�T�����)?~� ��oe�3�IUSA��¡��NO���)���&6��h��;�������3������h$�LK�� D�)����)�2�]�'�����g���!�';�i/�����c��������&�M���06�� �)6���*/�)�$+�� '���)���&��B!ndo�����S���������� ���VGI�����+��& ��������$���� �%<�����e�&� � ����0�/;���% ;@E}���*�+ �� % ���$$��N�)�4�rB!���c ��&%0�� �*��������c��"���;���) ��*�& ��7?@�)�%c�2;��+W�'�&�2;�� �)� %�?�A

¯w¢]±�Ä�´�ª�ËIÝTÐ3Î&ª�²�µ`£¥½yÎãµK¶�ª�© ¯�¹d± Ä»´�ª ËPÝTÐ Ä�´�£�ª�¢`¶K«Þ�©�µK§¥Ûgß�¦�ªj£�¢ £�§�´]½

Page 10: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

à ¿'úLáÖâ®»Mü�ãpþzÿ°¹�º�»Mý�º#�8»0¼

Bl�� d�'�)�����mEknk�@EpoM���)����&��;�@*��4�� ��[�����������,��"h�:���� ������������������������� �x$�5�';�>*�/������*�'�~$�>*�&�V+;0?>���������H��?>���������GI;�����/NO��;��6>�)� a6��� ����&�a� �¡�~���� �% �g ����% ����"F��+9�]�'��������������&��A�ÆJ�~��/���� ���������+���J�)�&6����R��;�a*�?>�9������&�P�� ��J�k?>+�)�T���)�)?�*�&���� ���NO��*WN0?W�������@E�'�)�>���v$�>*���l-_����?>������ä��"#B!�atI^ �21!GI;�� ��T���e����& �� ����� +����T�����)?S�';�5?,�� ��3��@*������&*N0?u�=�&� ���)���5�'��������"I*�)���& ��&���,+9�� d�'�)�����&��A��J�T���)���%WGI�)��;u�T���2;z��"P�';�&���4*�&���& ���+@�'���������&+9�� '�]�'���7?,�����4N��3+ �� N�����$���������0"8� M����d�2����&�3�';��a���� �% �3���T���)�J�� ��)������� MNO��;��6>�)� ��"I+������$�=���h*�&���� �$�)���*z�)�u+9�� d�gN0?zoM� ����� �N����0�'�& '���5�'������SNO�&�kGF���&�x�&�����5�' �� �����*W������P���*,��;:��I�T��������PNO�J"8����7?$*������& ��)N��&*~N0?W���&� �0�'�)�>������@*����Y����� ���A9ÆJ��';�S���';�& J;9����*�+;0?@�����������7?y ��T���)���d�'�������)�������'�)� ��I� ���,����& �� ����� +�)�h�)�&6����l ���b:��) ���:��NO�� ��M��"#+9�� d�'���&���&�a-.���/�';�3� �*�& M��"!�T��åkæm1!��;9���I�� ��3+� �� ;�)N�)���)6����)?����� �% �3N0?/���0?��� � ��&�:�J��� �+���'���'�)� �9���Y�d�2����*9�� �*���AYB��� ������&���5E}nk�@EdoM�&���H-.B!ndoP1I$�5�';�>*�����������+��i�'����) �����S6 �&�:�JN�����;[��"V��;��������������&�a���*=N ��)*% �r�';��% ��+=NO�&�kGF���&�<��;�S$���& �� ����� +�)�*�?>�9������&�P��"V�����2;y+�� ��������)�a���*W�';���$���& �� ����� +�)�aN��&;9�T6>��� P��"��';����d?>���'�&yA

ç:è�é ê ©�¬�ë�ì2­]í3ª9­]ëRî5ë9³8ïh­pðJñDò]ówì2­�ô>î2ï

U�BDndo������������'�)� �S�)�V��������& ���&*�GI�7�';��';��e�'����M�56 � �)���'�)� �g��"��kGF�r�k?>+O���!��"O� N>K��&�&�����+9�� d�'���&���&�����*������*���A]Bl�� d�'�)�����D�� '�LK��&�&�'�� ����&�l�� ��!��� �+������*hN:?r�)�0�'��%� '�������%i���5GP�'� �R^`���b:�9������� ����X0����9�����7?hGI ��)���'�������!�a�d?@�d�'�&õ��"�� ����dEk� �*�� !� �*����� �?h*�)Q��� ����0�'�������&b:�9�]E�'�)� ���AM§l���&��*�/�� ��=��� �����*�& ��&*w�&� �0�'�)�>��� ��4b:�9���0�'�7�'�)���4����*°�� ��[*�)���& ��&����(&��*�� ���-.����9���)�)?,����)"8� �yX� ����5�'�)�������T�� '1F% ��)*W�L6��� I�';��+ �� N���&�*��/���)�YAnk�~��� �0�� '���d��GI�7�';Zy� �)���������� c�3?>�9������&�c� $�r ���6>�7�2������� �9���e�IEk�M�>*�?���?>���������X!�';�~�&Q����5�/��"JN�)�9�� �?+9�� d�'���&�������0�'�& '���5�'�)� ��3�)�J��+�+ ��T\@��$���'�&*y6>���$�����7"�Ek�&� ����)�������0�a+9�� d�'�)�����mE}�9�&��*~���0�'�& '���mE�'�)� �YAC|>+��&���)��T���)�)? XO�';�c����'�)� �[��"M�4���)�% ���S+9�� ������&���SGI�7�';<+������)����� �yöDXY6 �&���>���)�k? º X

Page 11: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

���*~/�����P÷Ó�)�P% �)6����~N0?��÷�ø º

ø0ùyúû

ø öø ù ú

º-p�L1

GI;�� ��Iû��)����;�e"8� ��&�P���5�'����%J� ���';��P+9�� ������&����A]nk�c�J+������$���';��M"8� ��&�e���g%�����& '���@;9����kGM�i����$+O� ��&�:����X��&� � �����+O� �*����%P�'�P��;�D���)���&�� ��)�!���*r/��% ��&�����l�����*��C �����+��&�&���)6 �&�)?O�

ûú�ü

-8ýxþ ºzÿ�� 1

nk�/�';����H��b:�9������� �/��;�������*��M�� ������SNO�3�T����������������*,�]�M�����2;4+9�� d�'���&���I+O� ���7�'�����YA>oM� gE+���'���'�)� �9���)�)? X���;���D ���b:��� ����D�)�:���� �+�� �����'�)� �h"8 �� ���;�e��\@��*���+���'������% ���*g��"���;�e�9���)*��'�a�';��P���T�]���'�& ��&*/���5�H��"O+�� �)�0�'�!���DGI;�)�2;$+�� ��������)���D�� ��P��������)*�� ���*c�'�r ��&����*��IGI�7�';�)��';�a%��)6 �&�4�'����3�d�'�&+YA���a ��&"8�& M�'�g�';����e� +O�� ����'�)� �4�����e«m¬.ô����O­���ñP©�«m³.¬�ì�îiòmë9³pî5«}ª9­�7©��³_¬�­]ë9A

tDb>����'�)� �z-p�L1e���I��� �76 �&*[����)�%$���:���� ����T�����)�0�'��%� '������� �W���2;������X�"8� I����d�2����&����;��'�)$�mEk���&�0�'�� ���*<������+�"8 �� %,��&�';��@*YXV-_�M�) �*�������l���*<s#���%�*� �YXV�T� �0� 1mARUe�a�';��g���*<��"�T���2;��'�)$���7�'�& '������� �YXO�';��+O� ���7�'������a���*<6 �&���>���7�'���&�a��"M�����V+�� ��������)���r�� ��c�+�*���'�&*YXGI;���2;y���*�����&�3���~�+O*9������������;�h+�� ��������)�a*�������)�k?��/���*=�&� � ����0�� lX�N����';~�&6������>E���'�&*����D�';�P%� ���*�6��� d�'���&���&A>oe�����&����������%��S����*� ,"8 �� ¤�';�I���5�!��"����T�]���'�& ��&*$+9�� ��'�)���)�+������)����� ���e� �0�'�g�';��r�@\��&*=��+9���'�����R%� ���*4�)�P�T�� � ��)��*W� ���P6>���/ñe©�«m³_¬�ì�î���O­����e«m¬.ô4�)�0�'�� pE+������������ �YAR§9 �� Ó��;�g6�������&�h��"��[���*� �� �<�';��% ���*YXR��;�������&�&�� ���������*¡$��% ��5�'�)��9���)*�g�� ��/�&� $+����'�&*����*u�56 � �76 ��*z��; �� ��% ;��';��,��� � ��&�:�g������$�7�'�& '������� ��������+�N0?�:�$�& ��)�T���)�)?���� �)6>�)�%hZ=�]\>GM�&���_^`�H��b:�9������� ����A:qP;�3*��&�2�������D��"R�';����H���'�&+/�����$6��� d?c����%]E��)��T���0�'�7?z*�&+��&�*����%�� ���';�~��*��� ��7?>���%¡+;0?@�����&��XF���*�GM�y� $�7�g�';�& ���c�';�5?���)�,� ��������*��,�';�W���&� +O�y��"i�';����g*�)�����������)� �YADUÖ���2;��$���'�)�W*����%� '�� ��"i�';�4"8��*�]E$�&�0�2���F���'�&+�c���06 ���)6 �&*z���u��;�WBDndoõ������/�)���� ����'�)� ���5?@�&���4�)�S��;��LGI��� ��§l�)%AM-�� 1mAU3�i$�&�0�'�������*W���y|@�&�&����� ��-d�L1mX9*� ����%���B!ndow����S���������� �$�';�r�� ���I�'�)$�3���I��+O���0�

���

Page 12: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

ÊB¦�É�Ã�ÏFÃpÄ�½FÁc¦¨§j¢`©(¤¥¦¨²�ª&·¿¤¿ªjÁ §n½K§j©�ªãµ`À³¢�¡p°¿­Ú§nµF¶�ª`î¡B¢ £¥¤¥¦¨§j©�ªã£�ª�©¨¢ ¤¿ª�¶��F¾M¢`¬]¤¥¦¨¤¥¦�ª�·¢ £¥ª�¦¨¬c¶�ªnØFª�¶ ¹F½��¥ÃHÊB¦�ª�©¨¶��F¾M¢`¬I¤¥¦�¤¥¦�ª�·y¢ £¥ª)¤Y½IÁc¦¼§j¢`©¨©�½ ¶c¦¨·¥§n£¥ªj¤¥¦��jª�¶ µA¬ ¢2¾M¬M¦�À�µ`£�²£¥ª�§n¤¥¦¨©¼¦¨¬�ª�¢ £(É`£�¦¨¶��F¤¥´Mª�¦�£�¦¨¬M¶�ªnØ�¦¨¬�É�¦¨·(¬Mµ`¤»·¥´�µ�º»¬y´�ªj£¥ª

� �x��;�=�r ���*@E}q���EkBl�� d�'�)�����,���*�B��� ������&���5E}q��]Ed�a ���*z�)�0�'�� �+������������ �z�d�'��+���A!���W"8�@�&��� �z�';�4���������� h���������4�)��+ ���6 �&�g�'��NO�,�';�4�� ��/��� �+���'���'�)� �9���)�)?��2;9�������&�% �)�%[��"�';�r�kGF���$� �����6 �& i��;�r�'����r���� '������%�?W�&$+�)��? ��*~�'�����0�'�& �+O� ���]�'�ab:�9���0�'�7�'�)���P"8 �� +9�� d�'���&���&�F�'�S% ��)*$GF� �f:�I���)$� �d�F6��� �N9���'�)�)�/�';��J� ++O� ���7�'��*�� ����&����� �/���M��;�����J�kGM�� +O�� '�]�'������I�� ���X���~�c���&�����XO*��9���Y�'�c�����2;=����;�� &A

� �hã�»[¿��dý`üL�_� �8»"!#�}þ$!5¾)ý]�lÿ ú�ûTüT»cýLÃ(þ%�&�ÈüL�vþTû£¹cÃD»Mý'�ÈüL�vþTû

qP;�HBl�� d�'�)�����mEkq���Ed�a ��)*3�)�:���� �+�� �����'�)� �3��+��& '������� �J%�����& '���)��(��&�R�';��!".��$�)������ 9;���d�'� % �����++ ��T\��)/�]�'��������"r�';���+;9��������+9���&��+� �� N9��N���)�)�k?�*�&����7�k?�"8���5�'�����£� �0�'���z����E"8� � ��&�&�������)��T�� M% ���*YA|@+��&���7�9�T���)�)?�X@�)�4*����������� � ø X�% �)6����~��N��T\,��;9��+O��*W*��/���)�(

ú)+*-,.0/�,21 ÿ43�3�3Oÿ )+* 56.#/#5�187:9 5 XC�,���&����"H+O� ���0�'�<;#= ,. = å . 3�3�3 . =->@? 7 (=XR���*��

���7"8� �É% ��)*ACB2DFE

ú;'GIH

ú5JKL ,NM K » KPO M KRQTS ? 7 (

�';�a6����)��a��"��';�r+ �� N9��N�)���7�k?/*�&����7�k?,"8���5�'�)� �VU����I�����2;W6 �� d�'�m\�G�He�)���Ul-WG�H�1

ú>J X L ,@Y

X[Z -WG�H . = X 1 -_� 1

� �

Page 13: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

GI;�� ��]\ú

; M ,. M å . 3^3�3 . M 5 ?3���H��S��)���7Ek�)�*�m\RX_; » K ?a�� ��I� d�';� ��� �$���N9�������!6 �&�&��� ����� 9 5 X`; Y

X ?S�� ��aGF����%�;:�I�&�@�5¢������&�0�'��XO����* Z ���I���W���0���� �+O� �����'�)� �,f��& ���&��A

nk�$�� �d�!+ '���5�'�)�T���9��++���)�T������� ��� Z �)�!�r�)�@������)������� V���0���� �+O� �����'�)� ��f��& ���&����"��������� + ��>*��5�/�k?>+O��X!GI;���2;��)��*�)$�&����)� ��� ��~�����5\@���+���7�9��*xN0?���;�y".��$�)������ × ;9�]�'Ø"8���5�'�����Y��"8� P�)����'��������gf��& ���&��GI�7�';W����++��� ��i���+�+ Z

ú-ba�� . ��1M���P*�5�9���*=�����

Z -_� .dc 1ú

effffg ffffh�ia O c O . �)" O c ONj �� . ���';�& �GI�)���

nk�y*������������ �,�kGF�X9�)" Z ;���I���++O� d�I� �~��;�r���7�I��b:�9�� ���X

Z -�-.� . �01 . - ck.0l 1�1ú

effffg ffffh-p�ma O c O 1&-d�ia O l O 1 . �7" O c ONj � X9���* O l O"j �� . ���';�& �GI�����

���4�ub:�9��* '�������="8����&����� �YXHGI;� ����%� '��+;£�)�4�u+�)�����5GI������;:?>+O�� �N�� �)���[��;���5�TAeqP;������� �����' ���&����� �~ �����*�)�)?$% ����& '���)��(&���P�'�c;�)% ;�� P*������������ ��&A

qP;�J����3��"C�S���>�T���9�)������� !���0�'�& �+O� ���]�'������f��� ��������"Y�';����F�k?>+O�3�)$+�)���&�V�';9���F"8� H�T���2;6 �& ��'�m\nG�HF����)?�+9�� d�'�)�����&�F�&� �0�2���)���*4�)�,���&���)�F�)����)*���0�MGI�7�';oG�H!GI������;9�T6��a�� �0�' ��)6>�������� �0�� ���N����'�)� �4�'�g�';�r���ä���~tDb:�9������� �¡-���15�

UV-&GIH�1ú

Jp�q[r^s@tvu2w2x YXyZ -WG�H . = X 1 - ¥ 1

GI;�� ��{zI-&GIH�1M���P��;�r��� �)�����5�'�)� �,��"�+9�� d�'���&���&�P���4�';�r�&�����)�P����&��*�&�0�PGI�)�';46��� ����5\�G�H&A§9� i��+9�� ��'�)���)��= X ���&�}|�-F= X 1

ú;'GIH�~ . 3�3^3 . G�HW��?�*�&���������;�h���&����"

ühú� 5 6 �� d�'�)�����i��"

�';�g%� ���*=�����)�����,GI;���2;n= X N��&��� �%���AOqP;�g��� �0�� ���N����'�)� �[��"k= X ���,�';�h6����������"8Uu����T���2;~6 �& ��'�m\TGI� Q |3-�= X 1e�)�i+� ����&�������)? Y

X[Z -WGI� . = X 1mA9qP;���i�5\@+ ���������� �=;9���i% ��� ��&�� ��)�

�L�

Page 14: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

���0�'�& �+ ��&�'���'�)� �w���4�';�¡tD����)��*������$������� ���"8�� ,�';�<6 � �)��� × � ++O� ���7�'�&Ø�������;�6 �& ��'�m\�GI��GI�)��;c �����+��&�&�D����= X A0§9� �����d�2��������X����g*�)$�&����)� � ø ú

�@X���;�P��� �0�� ���N����'�)� ���"l�c+�� ��������)�a�T���~NO�a��� �+������*W6@�����';� × � +�+�� ���)���r�� �����Øg"8� �������W-.������§l�)%AC- ¥ 1�1mA

ÊB¦�É�ÃN�FÃ�°X©¼©¨¾M·¿¤¿£�¢ ¤¥¦¨µA¬�µ`ÀŤ¥´Mª{�Zµ`ÁcÁȵA·�¦�¤¿ª³¢ £¥ª�¢6�ÕÀѵ`£�²�¾M©¼¢KÃ"��¢`§�´y¢ £¥ª�¢����0�d²�¾M©¨¤¥¦�Ác©¨¦�ª�¶¹F½y¤¥´�ª�º®ª�¦�ÉA´I¤�§nµFª#�'§j¦�ª�¬I¤�� X ¦¨·}¤¥´�ªÂ§nµA¬I¤¿£�¦�¹>¾�¤¥¦�µA¬ãµ`À-� X ¤¿µ3¤¥´Mª�Ác¢ £�¤¥¦¨§j©�ª�¶Mª�¬M·¥¦�¤Y½Àw¾M¬M§n¤¥¦�µA¬y¢ ¤�¤¥´Mª×¸`ªj£¥¤¿ªnØyµA¬y¤¥´�ª×µ`ÁcÁȵA·�¦�¤¿ª×¶M¦¨¢ É`µA¬M¢`©

�Oè�é óF­]í3ª%�>³}©�³.¬�­]ëO©����³.«�©�³kî���¬�î2ï

qP;�,�kGF��$��+�S*�&�9����*x��N���6���XV+9�� ��'�)���)�5E}����E}6��� d�'�5\��%= X��� |�-�= X 15Xl���*u6��� ����5\:E}����E+9�� d�'���&���&����G�H �� zI-WG�H'1M�� ��a���4��� ��a���������r*�9�����'�c�T���2;W����;�� &���';��&?4����'�76����'�i�kGM���� �+�)������0�2�� d?=�d�' ����'�&% ���&�3"8� 3�&� �+���'�)�%/��;�g+9�� d�'���&���h*������)�k?y"8���&����� ��U���6��� �';�r�&�:���� ���%� ���* A A

�Oè�é0è�é ñe©�«m³_¬�ì�îañ8�@ynk���';�)�a�T������+�� ��������)���a�� �� × +�������&*Ø4N0?[�';���%� ���*[6��� d�'���&���&A#B!�����*��=���>*�g�)�a% �)6�������WU3�)% � ��)�';��sC���d�'�)�%~-d�L1

�Oè�é0è�� ñe©�«m³_¬�ì�îañ8�0ï2´nk����;���D�������i+9�� d�'�)�����&�!�� �� × +���;���*Øh� �0�'�r�';�I% ���*�6 �& ��������&��A>BD���&�*�S�&�@*��i�)�!% �)6�������WU3�)% � ��)�';��sC���d�'�)�%~-�� 1

� ¥

Page 15: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

�@���-�N��� ��¡-¢"£¤¡�¢"£ ¥%¦N§�¢�¨ª©�¦'£$¨�¥½ZþÇý]»N�9�]ã�« î5«m³kî­¬{GIH Q A ÿpþ�9�*�zi-&GIH�15�®°¯ G�H0±m² �~�

½ZþÇý]»N�9�]ã = X Q zI-WG�H�1 ÿpþ®°¯ GIH­±m² ®°¯ G�H0±Pþ YXyZ -WG�H . = X 1

»>ûpÿ»>ûpÿ ³

�8ÄÇþÇý���üLã� ù ��Bl�� ��'�)���)�rB!�����

�@�¤´�µ¶¦'¥%¦I·_¸_¦�¹_¢ ®°¯ GIH­±½ZþÇý]»N�9�]ã�« î5«m³kî­¬{GIH Q A ÿpþ®°¯ G�H0±m² �~�»>ûpÿ�@���-�N��� ��¡-¢"£º�-·"£ ¥%¦N§ ¸"¢�¨ª©�¦'£�¨'¥½ZþÇý]»N�9�]ã ª�©�«m³.¬�ì�î»= X Q ( ÿpþ�9�*�|3-�= X 1m�

½ZþÇý]»N�9�]ã GIH Q |�-F= X 1 ÿpþ®°¯ GIH­±m² ®°¯ G�H0±Pþ YXyZ -WG�H . = X 1

»>ûpÿ»>ûpÿ ³

�8ÄÇþÅý]��üLã� ¸ ��Bl�� d�'�)�����rBD���;�Oè�� ê î5³8´9­�ô[óF­]í3ª�©�«m¬�ï�­]ë

t!���2;�$�5�';�>*z;9���g�7�'����GI����*�6����0�2��% ���c����*z*������*�6����0�2��%�����AVs#�5��¼ *�&����'�,��;��'���'���I�:��NO�� /��"a+9�� d�'���&���&�/����*¾½��';��y�'���2���I�:��NO�� $��"J6 �& ��������&��AFqP;��Bl�� ��'�)���)�BD���;y$�5�';�>*

¿ �)���î2ï2ï�î&À£ì5¬�î5ë9³5�9 ���b:��) ����}Á/-�-�� 5 þ��L1­¼=1e ��T��*�È]GI ��7�'�a� +O�� ����'�)� ��&�

¿ ;��GF�&6��� �X�|�-F= X 1F�)�P��"#��\@��*W���&�%��';W���*W���e ��T��*�)�)?$��� �+������*W*�?>�9������������7?g"8 �� ��;�r+9�� ������&����^ �e�&�@� �*������'�&��A

Ue�I�';�r�'��$�J�������X���;��Bl�� d�'���&���aBD��)�C$�5�';�>*

¿ �)�~í/­]«'î[î&À£ì5¬�î5ë9³m�! ��&b>���� ��&�ÂÁ/-�� 5 ¼Óþý1g ��T��*�È]GI ��7�'�W� +O�� ����'�)� ����D�)�x+� '���5�'���&�

� ±

Page 16: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

½�Ä ¼ ����*W��;:����&� �+���m\��7�k?,�)�P*� ����9������*4N0?4�';���$��% ���)�'��*�J��"ż¡�

¿ ;��GF�&6��� izI-WG�H�1!GF� ��)*/NO��+ �� ;�)N�)���)6 �&�)?g�m\@+��&����76 �3���S ��5�' ����&6��3*�?>�9��$�)�T���)�)?����@E�)�����I+9�� ��'�)���)���P�� ��r� �%0�����(&��*W���W����$�a�5¢$�&���&�:�i��+9���'�����Y*9�]�2�c���' ���&��� ���A

§9� ���;�� �$� ���XD�[*��� ��&�&�c+9�� '���)�����F���+���&$�&�0�2������� �¡��"I�';�~Bl�� ��'�)���)�4BD���;�$�5�';�>*���a+ �� ��g�'�W����� �?y���������)���)� ��3������&��|3-�= X 1J����*�|�-�=NÆ�1�GI�)����;9�T6 ���� �@E}���+��k?����>E�'�& ����&�&����� ��"8� a�T���2;�+9���� a��"e+9�� d�'�)�����&�{;#= X . =NÆ�?/�';�������r+ ��>���&������*u�������7�2������� ����)?N0?z��� ����� � ����0�c�';� ��T��*��ADqP;�~�T6���������N�)���)�k?[��"����'� ����$$�&$�� �?¡� +��& '������� ������� ����* ��&��� �76 �a�';�)�I���������X9;��LGF�&6��� 3���P�';�r�m\�+O�������S��"l ���*��&��*y+��& �"8� �/��������A

nk�<��**�7�'�)� �YXO�)�JNO���&� ����a���)�T�� i�';9�]�a�)"!�)$+�)������0�'�&*=GI�)��;� ���3$�>*�7�9�T������� �yN����';$�5�';�>*�WGM�����*°����Q��� W"8 �� ������$�� �w* '�TGIN9���2f�Xi�9������7?®«�©�ëOô>­]í í/î5í/­]«�Ç©>ì2ì2î2ï2ï5A�qP;�)�CGM� ����*r�@�&��� C������&�D"8� Y�T���2;<È�XL���*r�T���2;<\D��������)���&��������0������"�|�-F= X 15X�� zI-WG�H�1CGI���)��X����h+ ��)����)+����XL �������*�F�����&� �0�'�)% �� ��l�����)% ��&*h����� �?��)�@�����'�)� ���AT��;������F����� �% �e�����2;�3oeBH��$��?������)�&6>���]�'�F��;�I+ ���N���&{���c�������I��"R������ �������)$+���������0�'���'�)� �YX� �W�';�S��B!�® '���*� Ö����� �?,�����&�����3�T���=NO�h�cN�)%�+O�� d"8� �$����&�rN������'�)����&�2fOA�nk�+9�� d�'���&����� �X�"8�� /oe���iUÚ�< �����*�È]GI ��)�'�W� +O�� ����'�)� �u"8 ���,È]���<% ��� N���M����� �?¡�2��f����± � �]Ek· � �<���)�@�2f��&?>�&������-8�';��=�'��$�~� +O�� '�]�'�����x�'�¡��;9�� ���*£����� d?z�2��f����,� ���)? ± 1mAqP;���i���]�'�����&?~�T���yN��h;��*�*���y�)"l��; �����*��+��& �"8� �ä�';�&�� i ��T��*�È]GI ��7�'��� +O�� '�]�'������I����~�&�0���)�����&��*�".����;�)� �YXC�_A`��A#�~N�)�@�2f���"M�';� ��T��*�h ��T��*���"8 �� -8GI ��)�����r�'�:1a�WN���>�2f[��"��*]K����&���0�I�k?>+��mEp���)��% ��&*W$�&$� d?/�)�@�����'�)� ��&A

���W�]���'�&$+@�g�'����6 �& �����$�4�';��4*�&�9�&�)���g��"3�����2;�$�5�';�>*zN0?u"8� ���)��GI���%=�[;:?>N ���*�k?>+�����++� ��0���2;�����*��� �%0������(��)�%,*9�]�2�,���<�/GM�T?[�';�����T6 � �)*�J�';�c�]"8� ��&$�&�:����� ����*+ ���N���&$�F���*,�)$+� ���6 �&�F�';����'�)$�I�&� $+����5\@�7�k?c��"Y�';��3����� �?����&���&���e� +O�� ����'�)� ��&A

�L�

Page 17: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

É ��þ>¼{�dý]ÿ³

û � \ ü$¿]�dý`üL�.� �.»"!0��þ-!&¾#ý]�Yÿ ú�ûÅü�»Mý]Ã(þ%�&�ÈüL�vþÅû³�8ÄÅþÇý]��üLã�Â

���W���GÉ"8�@�&��c� ��*������ ��)N����%¡�����5¢������&�0�/�)�:���� �+�� �����'�)� �u����% � ��)��;Á��+��&���7�9�T���)�)?�2���)��� ���*�"8� M�';�����B!�j+9�� '���)�����O���06>�� �� �����0�TAÆJ��a/��K�� M�&� ����� '���)�0�P��"#�';���rB!��';9�]��GM�W �������% ���(&�,���h�';�W���� ��0�S��"i� �@EkNO�0�� �*z$�&$�� �? X����� � ��&�0�'�)?z��· �0Zy�{"8� �����/�2;��+��a���*u� 3 � �r�°"8� �q��&������A�qP;:��&XC���y� �*�& 3�'�$�'�/��a���3$���0?=+�� ��������)�������+��������)N����X�GM�F�����������)$�)(��l��;�M����� �?3"8�@����+ ��)�0����"�';�F*9���'�i�d�' ����&�'�� �����GM�e��������*zGI;�&��&6��� �+�� �����)N���$ ����7?u� �z�)�@Ek+������&�/*9���'�=�' ������"8�� �$���'�)� ���A�qP;�,"8� �)����GI����%*������������)� ����������$�&�c��;9���g��;�����~��N>K����5�'�)6����$�� ��,�'��f��&�x�)�0�'�<��� ������*��� '�]�'����������������'�)$�&��A

§9 �� Û�';��<���9���7?@�����$������;�[+ ��&6>��� ���,���&�&�'�)� �£�)�/N��&��� ����,��++9�� ����0�4�';���4��".���d�����%�� ��7�';~^`�$*9���'��+ ��@�&����������%x�d�' '�]�'��%�?���;� ����*wN��<N9������*°� �w��;�¡Bl�� d�'���&���<BD��)�$�5�';�>*YAFÆJ��yGM�T?x���u*�����iGI�7�';��';�y��������[��"3�';�y���;�& ��&�:���)?������&¢����)���0�ÊzI-WG�H�1 ��5�' ��)�&6����e�)���'��� �% �����(&�,+9�� d�'�)�����&�g���������)��T�� ��� � ���?u����2;��';9���c"8� g�����2;4GIHS��;����)������0�'�I��"ËzI-WG�H�1e�>���&�+0?W���&� �0�'�)% �� ��P�����5�'�����y��"��';������ � ���?�A

Ì0è�é �Y´9î]ÍJ­�­6Î]í�©�«0Î0î�ô�ñP©�«m³.¬�ì�î�Ï3«m«�©�Ç

|@�++O� ������;9���W+O� ���0�'�& ��4$�� �f:�)�%u�';�<�&�*+O� ���0�'�W��"h�T���2;°�����&����� �w�� ��<% �)6����w����=�'�]�'���)���7�'� × N��>� f:$�� �f:Ø��� � '�T? A�U3�&���&���g�'��zI-WG�H�1��)���&¢����)���0�c���S�)������)?� ��&b:��� �������&b>�����0�'����� �' ���6��� ��'���0��":��;�!��� � �����+����*����%P�����5�'�)� �r��"@��;�D+9�� d�'�)�����l�� � ��T? ATq��I������ ���� �@E}��6 �� �����+�+���%~���&���&���h"8 �� Ó6��� ������&���S��;9�� ����%W����$�� �<���N����&���S��"M+9�� d�'���&���&�a����';�&�� F�������@�&��������*ÊzI-&GIH�1H���&����X@��;���H�k?>+�����"#*9���'�h���� ���5�'� ��3GF� ���*/;9�T6 �J�'�hN���/��*� ��&*��*9���:�����¡��;�,��������,�';9���S�T���2;�+9�� ������&���cGM� ����*u;9�T6��/�'����++����� S�)������)�'�)+������&�&�'�)� ��W��"��';���� � '�T? APqP;����,GF� ���*w ��&����7�W��������� �?x��� �+�)�5\@�)�k?���"{Á/-�� 5 ¼[1GI;���2;RXY% �)6����[��;������� �?~���)$�7�2������� ���e��"!�';�S��� � ����0�r% �&��� ����'�)� �<�rB!����X�GM� ����*

��·

Page 18: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

/��f��r�)�P����"8�T������N�)�J"8� I���0?W+ ����&�����T�����)?���T�������%�"8���R6�������&�P��"ż¡A

Ì0è�� �Y´9î�óFîy�Í�©]ï�î�ô�ñe©�«5³.¬�ì�îañ8�_y ê î5³�´9­�ô

U�6>����N�)�r���)���� ��9���'�76 �J�)�e�'� × �� '����d"8�� �Øc��;�r$�&$�� �?$ ���*���*9�����&?~��6 �� P���c��;�r% ��)**9���'���d�' ���&��� ���A�q��z�';�)�~�&�*YXeGF��GF� �f�GI�)�';£��;�<% ��)* A *��9���J�'� A �P��A ��AM��;����)������0�'����" A �� �����;�4� 5 Ek*�)$�&����)� �9���V�&���)���r��" A A�sC�&�RÐHa*�&������$�';��$�&�����DGI�7�';���7�'�7E}���*��5\�\����*[���5�Ñz�NO�S�';��S$��+y"8 �� Ö�';�����&�]Ò ��"!%� ���*y���&�����I�'�$�';�����&�]Ó��"�+9�� ������&�����&�

zc��Ò a � ÓÐH � a � ;#= Q Ó O = Q ÐH#?

��A ��A-zi-WÐH�1M�)�M�';�r�&� ���)���&����� �/��"�+9�� ������&�����M��� �0�2������&*~�)�ÊÐHmA��¡�a��@*�7"�?c�';��Bl�� ��'�)���)�BD����V��&��;�>*�*������& ��)N��&*¡�)��|>���&����� �x- ± A)��A)�L1I�'�~�����&� �$�>*9�����S"8� J�';����a�2;9����% �c����';�c���*�� ��)?>���%W*9�]�2�4���� ���5�'� ���A#nk�¡+�� ������������� &X�GF�$f�����+��4��� +0?<��"H�';�����&���S�@E��������*46��������a��"»U����i�T���2;y��"��';�h� 5 6 �& ��'�)���&����"ÅÐ�H5A9qP;����I$������P�';���P�';������� �?��� �+�)�5\@�)�k?W��"l�';�)����&��;�@*~GI���)��NO�<Á,-�� 5 ½1PGI;����2;="8� ]½nÄ ¼Á�)�J�$�&� �����*�& '��N�)����+ ���6�������0�P��6 �& I��;�a� ���% �)�9���96 �& ����)� �YA��¡�a�T�������';�)�e$�>*�7�9��*4��&��;�@*$�';�WóFîyÍ�©]ï�î�ôhñe©�«5³.¬�ì�îiñ��@y X>� Poe�eB!Bz"8� H��;� d�TX>���)����J+�� ��������)���F�� ��iNO������% × +�������&*ØS�������"��';�&�� P*9���'�g��� �0�2������& i���y�c+O�� P���&���CN9�������&A

§9� F��;�roe�eB!Bx��&��;�>*/�';�3N��>� f:/�� �f��&*4+9�� d�'���&������ � ��T?/*9�]�2�S�d�' ����&�'�� ��a ��&b:��� ������� ��r$�>*�7�9�T������� �W�������� �*�)�% �)?�An}"pX"8� I�������2�������XO+�� ��������)���I�� ����� � ����% �&*y���$�';���zI-ÔÐ�H�1g�>������+���&�,�¡�&� �0�'�)% �� ������&�&����� ����"3�';��=NO�@� f:$�� �f���*��� � ���?�"8� ��T���2;�% ��)*���&���mÐ�HmAVqP;�������&���&���c�'���T���2;x���N���5�Âzi-WÐH�1h�)�g���������H�&¢��&�����0������*YXV���)����4*�����������5����&�����$*�z����/��;9�� ���+9�� d�'�)�����&��XH*�+�)�������'�)� �x��"r*9���2�u�)�/�&�����������'�&*YADU3�4�u �������)��X

�L�

Page 19: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

�';�J��������&� �+���m\��7�k?/��"C�';��oe�eB!B�$�5�';�>*4����Á,-Ô¼�þz� 5 ½1mX@GI;�)�2;4"8� i½�Ä ¼Ó�)����+O�� ���� l��� �+9�� ���*S���ÑÁ,-�� 5 ¼�þ½1�"8� ��';� × �!�& ����5\��e�����&*Ø�Bl�� d�'�)�����MBD����>$�5�';�>**������������&*=���y|@�&�&����� � ± A7� A)��A

Ì0è�ç �Y´9î�óFîy����O­���ÕOî5«5³kî­¬�ÖSî5ë�ï5¬�³ÔÇRÏJì2ì�>í×�@7©�³_¬�­]ë=ñe©]ï2ï

qP;�i� ���'+����D"8 �� ��';��oe�eB!Bu��&�';��@*c���!���$�� � '�T?g��"C� 5 E��'�+������!��"O6��������������T���2;,� 5 E�'�+����r ��&+ ��&�����0���3�';�������:�� ��)N���'�)� �~��"l��;�h+�� ��������)���P�)�~��;�S�������>�������'�&*=�&�����Y������;�6�������&�I��"ØU<���P��;�a6 �� d�'�)�����i��"��';9���I�&���)��Aq��$��N��2���)�,�';�r�9�9���C+��& dE}6��� d�'�5\W6����)��a��"U����=��*�*�)����� �9���Y+9�����i��; �� ��% ;~��;��% ��)*~*���2�c���� ���5�'� ��h�)�i ���b:��) ���*RAR|>+��&���)��T���)�)? X�T���2;�6��� d�'�5\{GIH���" A +���2f:�V��+��5\����5�'�)?h� ��F6�������!"8 �� ¤�����2;c��"�';��I� 5 ���&���)�l��������*����0�GI�)��;/�)�J-.�����3§l��%A�- ± 1D"8�� M�S���j�5\����+�)��1!���*,������&���';��3% ���*c�' '�T6��� ������R�)�F����)"8� �yX�';�H�5\@�&��������� ���'����D���C��\@�&*h"8� #% �76 ���R½h���* ø ���7���)�#�����������������h� �*�& #��"$��% ��7�'�*����$�����)�� P�&� $+�� ��&*~���$�';���i��"V�';���oM�&�����e������*[B��� ������&����BD����#������+�-8���&�h*�)���&�������� �N��&����G�15A

ÊB¦�É�Ã�Ù�ÃF°Z©¨©¨¾c·¿¤¿£�¢ ¤¥¦�µA¬'µ`ÀǤ¥´�ª�¸`ªj£¥¤¿ªnØ�¢`§j§j¾c²�¾M©¼¢ ¤¥¦�µA¬'Ác£¥µF§nª�·�·#ÚF§nµ`£�£¥ª�·¿ÁdµA¬M¶M¦¨¬MÉ׸�¢`©¼¾�ª�·À�£¥µA² ¢`©¨©�§nª�©¨©¨·�·¥´M¢ £�¦¨¬MÉã¢&¸`ªj£¥¤¿ªnØ<¢ £¥ª3¢`§j§j¾M²Â¾M©¨¢ ¤¿ª�¶<¢`¬M¶�¤¥´�ª'£¥ª�·�¾M©�¤s¦¨·�·¿¤¿µ`£¥ª�¶<¦¨¬¤¥´�ª³µA¾�¤¿Á>¾�¤�¢ £¥£�¢�½

���

Page 20: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

Ì0èÛ� �Y´9îJñF«'îkªO«'­�ì2î2ï2ï5¬�ë@����³pîkª

qP;����������a�';9�]�I ���$���)��e�'�cNO�h��** ��&������*=�)�P;��Gj���/�� � '����% �J�';�r+9�� ��'�)���)���e�)�W��;�N��>� f:$�� �f���*�+�� ��������)���� � ���?� ���b:������)����"8� a��;�/�5¢$�&���&�:�S�5\@���&���'�)� �u��"M�';�/oe�eB!B����%�� ��7�';~ADÆJ��WGe�T?��'�¡���&��� �+���)��;��';�)�c���g"8� ��T���2;x+9�� ������&���4�'����� �+�����~��;�% ����N9���V�� � '�T?=���*�m\<��"!�';����&���)�l�'�4GI;�)�2;¡�7�aN��&��� ��% ���R��;��������c��;9���r�)�*�5\�����������0�'�&% �� lf��&?S�'�a���� ��H���)�@+9�� ��'�)���)����A��M�>� f:/�� �f:�V�T������;���cNO�P��� �+������*g ��T��*�)�)?h� �c����&��� �*c+9�����DN0?��&� $+�� ��)�%a��*]K��������0�!f��&?S6����)����&A ¨i�LGF�&6��� &X>+O�� d"8� ������%J�Mð��@y@ï�­]«m³���V��;�P���*c��"O�����2;$�7�'�& '������� �h��"��';�IBDndo��&�@*��P�T���gNO�P+ ���;��N�7�'�76 ���7?��5\@+��&����76 ��� "8� *������ ���N�)?~���� �% ��6�������&�J��"ܼ¯��;���5\@�&��������� �[������S��"H�/"8��)����� ��J��� ��)*[NO�����56 �� ����� �*��� ��I��"�$��% ��7�'�*�a���� �%��� e�&� $+�� ��&*W������;9���I��"��';��Soe�MBHB��d�'�&+y�7�'���&�)"pA

qP;�� ���b:��) ��&$�&�:�W"8� W�z"8��)�J+9�� d�'���&���[��� ��~�����°NO�< ��&���]\@��*w�)"rGF�¡�&� �����*�& W��;�*�?>�9������&�P��"�+9�� ������&���3�������� �,��>*���)��*,N0?,��;�rBDndow���>*��Ank�W/���0?,��++�)���T�]�'�������X"8� W����d�2��������XP+�� ��������)���W*������W�' ��T6 �� �����$�� ����';9���j�z"8�&G %� ���*��&�����a+O�� 4�������)���� '�]�'�����[������+YAYqP;����a��T������';9���r�� �d�a+9�� d�'���&���&��GI���)�l����a������6����';�&�� J �����+��&�&�'�76 ����&�����$���*x"8�&GÖGI���)�P* ��7"��$���,�� ���PÝ�ÞS�����)���$�TGe�T? AMsC�&�$��4����������X!GI�)��;� ���$��� �����"�% ����& '���)�)�k?�X��';���×Ý�Þ

ú� �l��;�W�T�����,GI;���ßÝ�ÞÂà �4N����c���������F��$�����_X��)�S�' ��T������*

���)$�)���� ��)? ADU������$����;9���~���������)�'�����I% ����N9���i��� d�W;9���WN��&����+O�� �"8�� ����*w���*£�';���+9�� d�'���&���&��;��6��/NO���&�z�� � ����% �&*��)���~N��>� f:/�� �f��&*�+9�� ��'�)���)�c�� � ���?�AC���$��;��Gõ�';�����"��'�& l�3B!ndo��7�'�& '������� ��������+�+9�� ��'�)���)�����T����NO�H ��T�� � '���% ��*����*�NO�@��f>$�� �f���*h���h+�����&�����Á,-W¼[1F�������A

q��h���2;�)�&6����';����DGM���2;9���%��i��;� × % '���:����� ��7�k?>Øa��"R��;��NO�>� f:/�� �f��&*$+9�� ��'�)���)���� � '�T?�Ank�<+9�� ������&����� &X�GF�c����& ��T�������';�������(&�g��"M�����2;�N��>� f:/�� �f��&*����&�&�'�)� �<�'�4����������*�c�����+9�� d�'���&���&�I��;9���3/��+~����i�'�$���)�% ���r�&�����#N�@�J '�]�';�& i���,�<ì��0ï5³kî5«���"D���&�����&A9���� ��5"8�� �'���';�&���S�&����� �% �&*=NO�@� f:$�� �f���*y+9�� ������&������ � ��T?W�����5�'�)� ��J����²�¬�ë�ï5A�Zy� ��h+� ����&�������)?�X

���

Page 21: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

���5��Ò�>ú

;�ÐH ~ . 3�3�3 . ÐHWá ?JNO�3�r���)������� !��"Y�&���)����A0qP;����$��;�iN�����������>�����]�'��*cGI�)��;ÂÒ�>r�)�zI-ÔÒ�> 15X9GI;�� ��×z��)�i��;�h�&���)�7E}����Ek+�� ��������)���e$��+~*�&����*��)�y�����&����� �[�@AÔ�@A9���h�2;�@������';�g%���� ��&�� �?y��"!�';�g�&����d�'�� ��a��������2;��/GM�T?[�';���r��"����� J� ���cB!ndo®�)���� ����'�)� �[������++9�� d�'���&���&��GI�)���I���7�';�& /���'�T?�GI�)��;�����';�y�'����[N�)��� �GI���)�i���6 ���]�,�� �����'����;���*]K����&���0�F� ���A:Uw�9����� '���9��� ���@�'�����$�)�!���h*��&�9��3���&���)�O�&����d�'�& H���h�&� ����)���F��"C������&�����)��';9�]�D���)�M� �c�J;0?>+��& dE}������Ng��"O����E}*����������� �$�P���×(y��"8� V�)����'����&�M�2��f��e�';�P�&� ���)���5�'�������"����&�����FGI�)�';~�������% �)�3��\@��*W�)�*�5\�AqeGF�$��*]K����&���0�IN�����P���,�';��aN��>� f:/�� �f��&*~�� � ���?/��+�������*]K������&�0�y�&����d�'�& ��~���£�';�<% ���*����&���r�� � '�T?Å-8�����¡§l�)%Aa-_� 1�1mAI§��� 4��+O�����7�9��� ��2;��)�'�&�&��� ��&�e-8��A %ALoe�3�IUa1mXL���*�+ ���N���&j���)(��&��XL;��GM�56 �& �X]����2;h;:?>+O�� pEk������Nr���)������� +9�� d�'�)����� �����%g$�T?W����iN���"8�T������N�)�r*��r�'�$��;��������)����*4��;9�� ��&*[����� �?4 ������ � ��&����T6���������N����+��& g���7�'��+� ��>��������� &A�U��)���� �����'�76 �,+9�� ��'�7�'�)� �����%y���2;��������� ��4*�������������*���y|@�&�&�'�)� �¡-_·�A ± 1mA

ÊB¦�É�à âFÃ�¡B¢ £¥¤¥¦¨§j©�ª�·Æ¯�¹c©¨¾�ª�§j¦�£�§j©�ª�·�±z¢ £¥ª�Ác¢ £¥¤¥¦�¤¥¦¨µA¬�ª�¶3¦¼¬]¤¿µ�¹c¦¨¬M·#�I§nª�©¨©¨·Æ¯�¹M£¥µ�º}¬3·°�F¾M¢ £¥ª�·�±�¢ £¥ªÉ`£�µA¾�Ádª�¶ã¦¨¬ã§j©¨¾c·¿¤¿ªj£�·jÃMá�©¨©�Ác¢ £�¤¥¦¨§j©�ª�·�¦¨¬&¢�¹c¦¨¬�¹dª�©�µA¬�É�¤¿µ�¢�·¥¦¨¬MÉA©�ª×§j©¨¾M·¿¤¿ªj£»µ`À�§nª�©¨©¨·jÃMÄ�´Mªµ`£�¶�ªj£�µ`ÀBÁc¢ £¥¤¥¦¨§j©¨ª�·�º»¦�¤¥´M¦¨¬�ª�¢`§�´*§j©¨¾c·¿¤¿ªj£�¦¨·�¦�£�£¥ª�©�ªj¸ ¢`¬]¤jÃ

qP;�/f��&?�� N���� d6��]�'��������;9����/��f����S�~+�� ��������)�cN��������%~���)% � ��7�';Ú��"iÁ/-Ô¼=1a�&� gE+���m\@�)�k?�+��������)N�������r�';���h��;�4oe�MBHB¤��&�';��@*¡*�@�&�S�����*�&+��&�*z� �¡��;�/�� �*�& S��"+9�� d�'���&���&�!GI�7�';�)�c�T���2;,N��������*��';:��e��� × �)�����$+�)�&����Ør+9�� d�'���&���P��� ��!GF� ���*$����¢��&��AÆJ� i����% �� ��)��;v��� �������d�'�I��"��kGM�$+9���������&�

¿��dý`üL�_� �8»äã4»"!'½Xý���Ä�¡»>ûÅü6�ÈüL�vþÅû U�"��'�& <��B!ndo �)�'�& '������� �j���'�&+YXr�T���2;Å�5\@�)���'�)�%+9�� d�'���&���~N���xGI�����I�&� �0�2���)���'; ����=�k?>+O���,��"r+9�� ������&�����&�H��;� ���=�';9�]�, ��&/�����xGI�7�';�)��';�¡N���R�I���*j��;� �����';9�]�=��&��*j����NO�¡���6 �&*j�'���';��N���°� �°��;�� ���% ;0�~� ~� ��';�S���&"��3 ��&��+O���&���)6����)?�AY�J� ����%$�';�gB��� ������&���h�J�5E}"8 ���% ����0�2�]�'�����y+9�����a+9�� d�'�)�����&�J�� ��

���

Page 22: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

+9�� d�'�)����� ����*����£�';� �����% �� �+�WGI�)��;w �����+��&�&�=������;���������@�&��������*w���&���r���*��5\£GI�7�';+�)6����e6����)����e*��&�'�& ������&*4N0?/�';��a�����)�R�&����d�'�� MN�� ���*9�� d?,����*�5\�A9Z~� ��a��+��&���)��T���)�)? X���5�oÓ

ú;#= X ~ . 3�3^3 . = X á ?<NO�[��N������"a+9�� d�'�)�����&����;9���$/��+�$���u���&����d�'�� $��"a�&�����)�

Òú

;�Ð�H°~ . 3�3�3 . ÐHWå»?:A|@�)����J�S���&���R�&����d�'�& �X>N:?/*�&���)����� �YX:�)�M������*/�����e�)�,��� �0����% �����$�&$�� �?/��;�r���5����"l����)�'��Ek�)�*���&���};�\ ,�. 3�3^3 . \�æi?S��� � �����+����*�I�'���g���&�i��"���������&���@E�'�76 �r���0�'�&% �� I% ���*y�� � ��T?4���*������&��;ç . çaþw� . 3�3�3 . çJþ�÷T?:A�§9� I�c+9�� d�'�)������= X �)�&�}è�-F= X 1*�������'�=��;���������>�������'�&*£���0�'�&% �� $% ��)*£�� � ��T?x�)�*�m\RAFqP;��% �0���i��"a�';�)�,+9�����,�����'�+9�� d�'�)����� �,��;�r���5��Ó����0�'�g�';� ����r���N���5�'�&�

éú

;#= Q Ó O è�-�=O1 j ç-?ê

ú;#= Q Ó O è�-�=O1�à�çJþ�÷T?

ëú

;#= Q Ó O ç j ú è�-F=O1 j ú ç3þ�÷T?qP;���M���P���&��� �+�)����;���*,N0?,�&���&$�&�:�e��GM��++�)�%g���/�kGF�c��� �������&���'�76 �a�' ��T6 �� ��'���)�P��"ìÓcX� ���"8� �GM�� �*RX�GI�7�';y+�)6�����6����)�����b:�9���#�'�Rç4���*[� ���hN9���2f:GM�� �*YX�GI�7�';=+��)6 ����6����)����b:�9���e����ç�þj÷ -.�����WU3�)% � ��)�';�¯sC���d�'�)�%�- ¥ 1�15AÅnk�z�';�W����*x�';��4�����&$�&�0�'�c��"�Ó�� ��S+��& ��������*��)�[����2;��/GM�T?=�';����Ó

ú;�éP� ë �#êR?:A��M�>� f:/�� �f:�a�� �����*]K������'�&*��'�

���*����T�]�'�J�';����&�*+O� ���0���i��" ë -.���&�S§���%AY-_·01�15A

ÊB¦�É�Ã�íFÃMÏ�¾M£�¦¨¬�ÉÕÀ�£�¢ ÉA²�ª�¬I¤¥¢ ¤¥¦�µA¬M·�Á>¢ £¥¤¥¦¨§j©�ª�·(¢ £¥ª×©¼¢ ¹Èª�©¨ª�¶��bîm�KÍì�X«W�KÍc¢`¬M¶��bïm��¢`§j§nµ`£�¶M¦¨¬�ɤ¿µ�º»´�ªj£¥ª(¤¥´Mªj½ÂÉ`µ ÚI£�¦�ÉA´I¤�¬�ª�¦�ÉA´I¹dµ`£�ÍA©�ªjÀ�¤p¬�ª�¦�ÉA´I¹dµ`£zµ`£�·¥¢`²�ª»¹c¦¨¬Õ£¥ª�·¿Ádª�§n¤¥¦�¸`ª�©¨½`Í]¢`¬M¶�¤¥´�ª�¬·�´M¦�À�¤¿ª�¶Õ¤¿µs¤¥´�ª�§nµ`£¥£�ª�·¿ÁdµA¬M¶M¦¨¬�ɳ·¿ª�§n¤¥¦¨µA¬�µ`Àdª�¢`§�´�Á>¢ £¥¤¥¦¨§j©�ª(¹c¦¼¬�Ã�Þ�µFµ`ÛK²�¢ £¥ÛK·�¢ £¥ª»¢`¶^ð¥¾M·¿¤¿ª�¶¤¿µ�²�¢ £¥Û�¤¥´�ª³ª�¬M¶�ÁdµA¦¨¬I¤¥·�µ`À�¤¥´�ªs²�¦¨¶c¶M©�ªÆ·¿ª�§n¤¥¦�µA¬

�@�

Page 23: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

�@���-�N��� ��¡-¢"£º�-·"£ ¥%¦N§ ¸"¢¾ñ¶¦�µ%¨½ZþÇý]»N�9�]ã ª�©�«m³.¬�ì�îS²�¬�ënÓ � ÿpþ

ù æX ><² �)�LGF���d�i�����)�C���*��5\W�)�,�';�r���)������� i�������>�����]�'��*WGI�)��;�Ó � �

ù æÅò°ó]² ;�)% ;���d�I���&���Y�)�*�5\4���4�';�r�&����d�'�� i�������>�������'�&*WGI�7�';VÓ � �ô ² �)��GM�&���i+9�� d�'���&���a�)�*�5\,��"ØÓ � �õ ² ;�)% ;���d�I+9�� d�'���&���a�)�*�5\,��"ØÓ � ��N�÷ö-�I£ ø-·"£Nùú¨'ø�·��N�¶¦�µ_ûº�-·-¨N¨½ZþÇýL»@���ã = X Q Ó � ¬�ë<©]ï�ì2î5ëOô�¬�ë@�4­]«�ô>î5« ÿ�þ

�8½ è�-�= X 1 j ù æX > üLã#»cû¨'ø�·�� -�= X . =$ü:13�ô ² ô þw���»cû�ÿ

»cû�ÿ�N�÷ý_·�§'þ@ø�·"£Nùú¨'ø-·I�N�¶¦�µ�ûÿ�$·�¨N¨½ZþÇýL»@���ã = X Q Ó � ¬�ë<ô>î2ï�ì2î5ëOô�¬�ë@�4­]«�ô>î5« ÿ�þ

�8½ è�-�= X 1�à ù æ òbó üLã#»cû¨'ø�·�� -�= X . = � 13�õ ² õ a����»cû�ÿ»cû�ÿ�N��� ¥¤¥��¶¦ ¨����_¦6µ@¥ ô ·Iµ�ù õ · £_¢ª¥��-¢÷µ$¢�øº¥-¢��@���I£�·"£�¤ñ��N�Iþ�$·"£ þ%¨¦�µ_ù�¦N§�·�¥%¦�µ�ûC¥��-¢ªñ����Nµ_ù�·"£�¦I¢�¨C��©ÿ¥��$¢Ã¨ �@ñ%¨�¢�¥ ë � ��©µ��'µ�����¦'ûN£_·"¥%¦�µ_ûC�$·"£ ¥%¦ §N¸"¢�¨

»>ûpÿ ³�.ÄÇþÇý]�vüLã� à �9B��� ��������)�r�J�5E�"8 '��% ����0�'���'�)� �

¿]�dý`üL�.� �8»��,»"!��pý'�9����»�üL�lû�Ä U�"����� ,�¡�J�5E�"8 '��% ����0�'���'�)� �����'�&+�+9�� d�'�)�����&�$�)����;�é����* êÖ���N���&���g��"I�T���2;4Ó¦����&*z�'�[NO�,��GM��++O��*zGI�7�';u�';�� ���,�)���';��4��*]K����&���0�N���RA#Zy� ���+� ����&�������)?�XC�)"�Ó �

ú;�é � � ë � �#ê � ?,���*�Ó ��� ,

ú;�é ��� , ë ��� , �0ê ��� , ?,�� ��g�kGM�

��*]K����&���0�aN�)��3��;���[��;�cBl�� d�'�)�����SÕi�mEkN ����2f��5�'�)�%4������+[GI���)���dGe��+<��;�����N���5� é ��� ,GI�)��;Tê � ��&����7�'�)�%$�)�=��5GÅN�����Ó �

ú;�é � � ë � �#é ��� , ?c����* Ó ��� ,

ú;�ê � � ë ��� , �0ê ��� , ?:A

qP;�SNO�>� f:/�� �f:�i��"»Ó � ���*TÓ ��� , GI�����RN��� �����*]K���d�'��*y�'�/$�� �f/�';����5G¤N�� ���*9�� d?N��5�kGM�&���=��;�� -.���&�S§���%AY-�� 1�15A

qP;���l���'�&+c���lN�����&*g� ���';�M�'����e��GM��++����%a�d�' '�]�'��%�?S�����*c���S� ��e��"9��;�e�kGF�a+9�����������"l��;���J�5E�"8 '��% ����0�'���'�)� �4������+Y�����4��;��Õi�mEkN ����2f��5�'����%/�T�����r�';�& ��r���i�c������% ���a+9������';9�]��"8� ������2;��i�' ��T6 �� ����&������)?��';�4�&���&$�&�:���g��"�ê � ���*4é ��� , ���*z�dGe��+�g�';�&

� �

Page 24: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

ÊB¦�É�Ã:ÑIÃKÏ�¾M£�¦¨¬�É���ªn«v¹M£�¢`§�Û`ªj¤¥¦¨¬�ÉÂÁc¢ £¥¤¥¦¨§j©¨ª�·pÀ�£¥µA²¢`¶^ð¿¢`§nª�¬I¤�¹c¦¨¬M·p¢ £¥ª�·¥º®¢ ÁMÁdª�¶3¢`§j§nµ`£�¶M¦¨¬�ɤ¿µ�¤¥´Mª�¦�£®¶Mª�·¥¦�ÉA¬M¢ ¤¥¦�µA¬3À�£¥µA²¤¥´�ª³Ï}ªn«vÀ�£�¢ ÉA²�ª�¬I¤¥¢ ¤¥¦�µA¬ã·¥¤¿ªjÁÇÃ0Þ�µFµ`ÛK²�¢ £¥ÛK·®¢ £�ªÆ¢`¶�ð¿¾M·¥¤¿ª�¶3¤¿µ²'¢ £¥Û�¤¥´�ª³ª�¬M¶�ÁdµA¦¨¬I¤¥·�µ`ÀT¤¥´Mª×¹dªjÉA¦¨¬M¬M¦¨¬MÉ¢`¬M¶�¤¥´Mª×ª�¬M¶yµ`À�¤¥´�ª×£¥ª�·�´M¢ Ádª�¶�¹c¦¨¬M·

GI�)��;�+��)6 ���H6����)��P��b:�9����'�a�';�i�������>�������'�&*$�&���������������'�& !N�� ���*9�� d? A0qP;�I����$+�)�5\@�)�k?��"#�';�)�M�d�'��+W*�&+��&�*�I� �,��;�J�:��NO�� P��"#+�� ��������)���M��;9���M���T�T6��J�';�&�� eN�)���X>GI;���2;4�)��k?>+���������7?y����)?y�,��$���)��"8 ����&����� �[��"ܼ¡AYn}�a�)�3�)$+O� ��'���0�����4������S�';9�]�a���[����������;�/�L\��)�� ���&���F�� '�T6 �& ������I�>���N��& ×Ý�ÞoàÓ� Xl�';��WBl�� d�'���&���4�J�mE}"8 ���% ����0�2������� �u���*Õi�mEkN ����2f��5�'�)�%h�d�'�&+�F*��h����F�2;���% ���:��;�&?iK�����H��&��*$���hNO�I ����Ý�Þ��'�)$�&�D�����a ���GrA§9� M��/���)�O6����)����M��"kÝ�ÞD�';��J ��&����7�'����%���� �+�)�5\@�)�k?$���F���'�)���O��$�������&� $+�� ��&*,�'���';�����"�"8����Y+�� ��������)�J���� ��'�)�%A

Ì0èyÌ ���>ígí�©�«Ç

oM� �N�)�����%h�';��a����%�� ��7�';µ�)�% ���*�)���0�'�F*�������������*W����".�� FGF�J����$$�� ��)(��I�';�3/���)���� �+O� ����0���i��"V�g".�����iB��� ������&���5E}q��]Ed�a ���*/nk�:���� �+�� �����'�)� �4U3�)% � ��)�';�

-p�L1yñP©�«m³.¬�ì�î»ÍI¬�ë9ë9¬�ë@����������)���'�)�%I��"@+9�� ������&���V"8 '��% $�&�0�2������� ���"8� ���)�LGF��*aN0?r+9�� ��'�)���)� ��5E}N '���2f��&�����%��

-_� 1yñP©�«m³.¬�ì�î����­��móFîy-Ö�î5ë�ï5¬�³WÇ<Ö�îkª9­�ï5¬�³.¬�­]ëW�T�� � ����&*,� ���FN0?$��;�roM�&�����e�����&*WBl�� d�'��E�����rBD��)�#����%�� ��7�';~�

- ¥ 1zóFîy�����­���ÕOî5«m³pî­¬nÖ�î5ë�ï5¬�³WÇÂÏ3ì2ì�>í×�_7©�³.¬�­]ëuGI;���2;�+ ��@*�������r�';��c��9���!�� � '�T?���"+9�� ������&���J*�&����7�k?46�������&�I���i�T���2;~% ���*46 �& ��'�m\�A

� ¥

Page 25: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

� áSÀÊã³ú�¡ÃÅ�8»>Â�»cûTü6�ÈüL�vþÅû�þ�½i¿]�dý`üL�.� �.»"!0��þ-!&¾#ý]�Yÿ ú�ûTü�»MýLÃ(þ¶�&�ÈüL�vþÅû

���r���Gj*����������I��;�r���+���&$�&�0�2������� �$��"���;�rBl�� ��'�)���)�5Ekq���Ep�r ���*,�)�:���� �+�� �����'�)� �/��+@E�� ����'�)� ��� �����x�I�Jnp�JnkU¶oe�3�IUÚ% '��+�;���&�g+ ��>���&������ �AD���4"8�>����c� ���';��~�������~��"�[�'; ����4*�)$�&����)� �9���H*� $�����¡GI�)�';�+O�� ����>*���$N�� ���*9�� d?u�����*�)����� ����ADÆJ��4��"i��;�/�����/NO�����&����P��"C�';��".�����IB��� ������&���5E}q��]Ed�a ���*�nk�0�'�& �+O� ��������� �$U3�)% � ��7�';õ�)�F��;9���M��;�*9���'�,���' ���&��� ��&�S���*��';�g*9�]�2�,$���9��% �&$�&�0�a���� '������% �)���J��aGF���)�V���0�'�,��;��oe�3�IU+ ���% '�������%:È]�5\@���&���'�)� ��$�>*�&��AYnk��+9�� d�'���&����� �XY ����*� Ó% ��� N���V����� �?<�������&���;9���hN��&���z���)������9�]�'��*¡���*�*9���2�~;9����NO���&�u� �%0����)(���*���������)���h�';���������uNO�/+ ���E���&�����&*[����*��+O���*����0�'�7?WN:?W�&� ��&� � ����0�3��; �����*��A�qP;��f��5?~+��& �"8� �/�������r���;������)�%���� '������%�?h;�� ��P�����'�a���)����Gu��; �����*�l���J���>� +O�� '�]�'�e�)��+ ��>���&�������%JN���'�2;�&�D��"�+9�� d�'�)�����&����'��% ��*~���W��;9�� ��&*y����� d? A

��è�é Öh©�³�©P��³_«��9ì5³Ô�>«'î2ï

qP;�� ����� ���"8��� � ��T���C6����)���*~b:�9���0�'�7�'���&�3�������>�������'�&*yGI�7�';y�$+9�� d�'�)��������'; �������+9�]�'��������>� �*����9�������~���*j��GF���)% ;0�TAIqP;����+9�]�'�����a���>� �*�)�9�������W*�&���� �$�)��<����b:��&�)?���;����*��5\W��"��';�r% ���*W���&���C�)�~GI;�)�2;~��;��+9�� ������&���J�)�i�&� �0�2���)���*RA9U3�)��;� �%�;W�����2;�����T�����)? ��&*��*9���:�c��;�����)�0�'��%��� ��)�*�5\����S���'�� ���*�����+9�� ����'�&�)?u���*z�����*x���c�[��� d�'�)�%[f��5?*� ����%��';��yB��� ������&���W�M�)������%����'�&+YAH§9� ���)�LGI�)�%[� ���~��"���;�4"8��*9������0�'���P���� ��T��+ ��>���&�������%W$���0�' '���JGM�g� �%0����)(�����;�g+9�� d�'���&���h*9���2�4�&� �0�2���)��� a���r�W�d�' ���&��� ��c��"���� ��T��$�~-�6@�&A!�����' ��T��Á��"����' ���&��� ��&�21mAHqP;:��g��;�� ��y�� ��,�6��~����+9�� '�����y�� � '�T?>�g��"���&�%��'; ¼¡XV� ���/"8� S�����2;���"P�';��/�6 �4+�� ��������)�,�����' ���N�������&AV|@�)$�)���� ��)?y"8� h��;�4% ��)*���&����*9���2�$��� �0�2������& �����;���&� �0�' ��)N������� �y��"!+9�� d�'���&���&���'�/�T���2;���"D��;���&��% ;0�36��� d�'���&��������4���&���V�)�J/�����0�2���)���*��)�<�4����+�� '�������� � ���?�A�ÆJ��g��"H�';�&���$�� � ���?>�r���3��)����$���'�&�)?����&*["8� 3�����'+�@�J*� ����%��';�S���' ��T��¦ ���*��5�'�)� �[� +O�� ����'�)� �=�)�y�';��coM���)�7Ekq���E��!�� ����5\

� ±

Page 26: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

�J������)�k?4U����&��������'�)� �~|>�'�&+u-8���&�hNO���)�LG�1mA

��è�� �Y´>«'î�©0ô �e«Ô�0©�ë9¬"!�©�³_¬�­]ë

ÆJ��Joe���iUw�'; ��T��*$N���>�2fg���H�������)% ���*$+��& F+�� ��������)�IN���YA0nk�$+ '���&�'�)�T���O��+�+���)�T������� ���';�SN���[����(&���������� �% �� i�';9���y�';��$�]\@��S�Ú�����)�LGM��N�)�a�'; ��T��*�a+O�� 3N���>�2f¡-��@�L�$����';�W�'�)$�W��"3�';�)�cGI ��)�����%:1g����*����¡�T���2;x�'; ��T��*x/��f����$���&6��� ����3�d�' ��)*������6 �& /�)�����������% ����*�N���YAR����)�����r��;�cN��������(&��;��++O����a�'�WNO�c�4���)����+�)�S��"H�';��gN���>�2f=����(���X��� ��J�';� ��T��*�iGI�)����N��r��*����J*�� �����%c��;�r�����d�I���� ���*���A

��;���)�y+� ��>���������)�%z�)���,��������%����*�+�� ��������)�yN����YXF�¡�';� ��T��*£N���>�2f����'�� ����,��;�=�)�0�'�� pE$�&*���]�'�P6�������&�F��"Y�';��+9�� d�'���&���P�&� �0�' ��)N������� ��!�'�h��;9�� ���*/$�&$� d? A>|@�)����i+9�� d�'�)�����&�GI�)��;���g��N���g�� ��e����D��� d�'�&*YX�GI ��)�'�M�����&�����!���J��;�� ��&*������ d?h�)�l ����*� Å ��&����7�'�)�%���,+O� ������N����i$�&$� d?c��� �)���)���������A:ÕI����� �)6>����%h�';������a�&� ���)������� ��!�)�F$��*��+�� �����)N����N:?/�× �';� ��T��*��'��% % �)�% Ø,�' ����2f=��;9���r�&�����]�'��������� �������;9�� ��&*������ �?=� +O�� '�]�'�������-.�����*������������)� �<����·�A ¥ A7�L15A�qP;�g� ����+���J"8 �� ¶�,f��� �����D�m\@�����@�'��*�N0?<�/�';� ��T��*�N���>�2fy�)�GI ��7���'�&�$�)�g�';���������@�&��������*����&���9���)������� H���g�';���% �)� N9���@���&���9*9���'���&� �0�2���)��� &A0qP; �����*��� ��~��?>��2;� �� ��)(��&*����$��;�=������5�/��"3�';�y� ���'+����/�d�2��%��=����*�GI ��7�'����%��)�$�&�0���)�����&��*������ ��)�%�� +��'�)/����+O�� d"8� �$����&��A

ÊB¦�É�Ã�ÝFÃzá.·¥¦¨¬�ÉA©�ª3Ác¢ £¥¤¥¦¨§j©¨ª3¹c¦¼¬Ü¦¨·ÂÁM£�µF§nª�·¥·¥ª�¶6¹I½�¢#¹>©�µF§�Û�µ`À$#&%�¤¥´�£¥ª�¢`¶c·jÃpÊK¦¨¬M§nª'#&%�¦¨·²Â¾M§�´�·¥²�¢`©¨©¨ªj£}¤¥´M¢`¬#¤¥´MªÕ¬F¾M²�¹dªj£�µ`À�Ác¢ £¥¤¥¦¨§j©¨ª�·�¦¼¬*¤¥´MªÂ¹>¦¨¬#·¿ªj¸`ªj£�¢`©B¹c¢ ¤¥§�´�ª�·³µ`À�·�¦��jª(#&%ª�¢`§�´)¢ £¥ªsÁc£¥µF§nª�·�·¿ª�¶*¦¼¬ã·¥¾M§j§nª�·¥·�¦�µA¬�Ã>Ä»´�ª�¦¨¬I¤¿ªj£�²�ª�¶c¦¨¢ ¤¿ªs£¥ª�·�¾M©�¤¥·�¢ £¥ªÕ¢`§j§j¾M²Â¾M©¨¢ ¤¿ª�¶Ô¦¨¬&¢·�´M¢ £¥ª�¶6²�ª�²�µ`£¥½Ü§nª�©¨©�¶M¢ ¤¥¢#·¿¤¿£�¾M§n¤¥¾�£�ª'µ`À}·�¦��jª'#&%}º»´M¦¨§�´Ü¦¼¬�¤¥´�ª�ª�¬M¶ÜÉ`ªj¤¥·Õº�£�¦¨¤¿¤¿ª�¬Ü¤¿µÉA©¨µ`¹c¢`©Ç²�ª�²�µ`£�½�¦¨¬y¢'§nµA¢`©�ª�·¥§nª�¶*À�¢`·¥´c¦�µA¬�Ã

� �

Page 27: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

��è�ç ) À£ì5¬�î5ë9³+*Yï�îg­pð3ñe©�«�©�y�î!ó!©>ì2´9î

�J� ��)�%���;�IBl�� ��'�)���)�e�M�)������%J���*���;�PB��� ��������)�5E}q���EpoM���)�@�J�&����7�k?��J�&+������)����� �h������+���;9�� ���*=$�&$� d?4���I�����*�����+9�� '���)�����R�T���2;�h���WGI;���2;y�'; ��T��*�i���'��% �h*9���2�g"8� I+ ���E���&�����)�%AHt!���2;��d�'�&+�;9�����¡*��)Q��� ��&�0�$+�� '���)���&�e�T���2;��y$���9��%�������0�����' ����'�&%�?z�';��� ��5Ò9���5�'�I�';�r�9����� ��r��"��';�����+��&���7�9������% �� ��)��;��M���06�� �)6���*YA

��è�ç:è�é ñe©�«m³_¬�ì�î�ÍI¬�ë9ë9¬�ë@��J� ��)�%W�';�)�S������+z�~+9���) h��"e+9�� ������&���cN9�����2;���c�� ��$ ��T��*£-.�����y�&�0�����&���&��*�".����;������1"8 �� ��';�I% �)� N9���+�� ��������)�I�� � ��T? X0� ��I�)�:���r��;9�� ���*$$�&$� d?g����*$� �����)�:���r���>�T���#-8+��& �'; ��T��*91I ���% �)���'�& ��&A9qP;�hN���'�2;y����(&�h�)�I��b:�9���C�'�c�';��h�:��NO�� iÝ % ��"Doe�3�IUÅ��; �����*�+��& �N����>�2fOA�qP;�hN9�����2;[���~��;9�� ���*=$�&$� d?4���& �6����r������� × �5\@�2;9���%��Sb:�������Ø���T���2;�'; ��T��*�����$+9�� ����V��;�I���&���9����*�5\���"���;�I+9�� d�'���&���P�)�g�)�'�D�)�@������ ���% �)������ DGI�)��;c��;�I��� pE ��&�:�I+��)6 ���e6�������3���*W��GM��+�i���&��� �*����% �)?cGI�)��;,�';�3+9�� ������&���3�)�/�';��a��5\>�i�T6���������N������)���g���u��;�W�5\@�2;9����% �Wb>�������AHUi"��'�& c�����F��GM��+���� ��4�&� �+���5�'��*z��;�,�'; ��T��*���+O�� pE"8� �µ�h��� �����&�����&*$GI ��)�'�i��"��';�I�kGM�hN9�����2;���eN���2fg���0�'��% �)� N9���9����� �?�A0§l�)% � ��h-.�01���)����d�' '�]�'���H�';�hoe���iU�6��� ������ �~��"��';�rB��� ������&���a�J�mE}"8 '��% $�&�0�2������� �4����% � ��)��;v+���mE�'� ������)�)?�A

|@�������r��� �+9�� ������ ��i�� ��r���� � �����*W� �@���&� ��&� � ����0�'�7? X9�';��� ��r� �@�'���'���*�)�%�+ �� N���������;��Gx���a�+�*���'�M��;�e�m\��2;���% �Ib:�������^ �!�'�����@�����' ��)N�����M�����J��?>��2; �� ���(&��*g".����;��� �RA

qP;�[�m\��2;���% �[b:��&����������+�)������0�'�&*����/���£�� � '�T?���"a����(��VÝ % ����*��)�����'�����I���dE�' ���N�������)�F�����+�)?����/���0����% �& M����*�5\$���0������;�J��m\@�e�T6���������N���P�&��������0�M���c�';�a�� � '�T?�AoM� ��Ò9�)�&�h�� ������&�r�)"F���&6��� ����F�&� ��&� � ����0�h��; �����*�h���������+��r�'�W�+O*9��������;�c���*�m\�����E���7�2����&� ����)? A#q���*�T���FGI�)��;¡��;���h��������/GF�4N��� � ���Gõ��;� × ��; �����*��2��% % ����% Øy�� ����2f����&*��)����;�~�i�3np�JnkUS^ ��;�������� % ���¯�������&���������� ���5\����+���¡-_B��@*���� (&;�0?@��fOXF�����0� 15A

��·

Page 28: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

ÊB¦�É�Ã-,FÃzá�¬Ü¦¨©¼©¨¾M·¿¤¿£�¢ ¤¥¦¨µA¬)µ`À}¡B¢ £¥¤¥¦¨§j©¨ª�Ï�ªn«vÀ�£�¢ ÉA²�ª�¬I¤¥¢ ¤¥¦�µA¬ ¦¨¬2­�Ì�Ï�ásÃzáÚ¤¥´M£¥ª�¢`¶<¹c©�µK§¥Û£�ª�¢`¶M·s¤¥´Mª3§j¾�£¥£�ª�¬]¤�ªnØK§�´M¢`¬�É`ª×�I¾Mª�¾�ªÔ¯�Ác¦¼¬�Û*¹>¢`§¥ÛFÉ`£¥µA¾M¬M¶>±×¦¨¬I¤¿µ*·¥´M¢ £�ª�¶�²�ª�²�µ`£�½`Í�¢`¬M¶¤¥´MªÂ§j¾�£�£¥ª�¬]¤»Ác¢ £¥¤¥¦¨§j©�ªs¹c¢ ¤¥§�´2¯�Ác¾�£�Ác©�ª³¹c¢`§�ÛIÉ`£¥µA¾c¬M¶>±(¦¼¬]¤¿µ�©�µF§j¢`©Å£¥ªjÉA¦¨·¿¤¿ªj£�·jÃ>Ä�´Mª×Ác¢ £¥¤¥¦¨§j©¨ª¹>¢ ¤¥§�´Ù¢`¬c¶2¤¥´�ªãªnØ�§�´M¢`¬MÉ`ªP�F¾�ª�¾�ªã¢ £¥ª&¦¼¬M¦�¤¥¦¨¢`©¨¦F�jª�¶Ü¦¨¶Mª�¬]¤¥¦¨§j¢`©¼©�½_Ú�º»¦�¤¥´ ¤¥´�ªyàM£�·¿¤.#&%ƹc¦¼¬ª�©¨ª�²�ª�¬]¤¥·'Àѵ`£�¤¥´Mª onq m�Þp� m¿�Ü��Þp��|]|>uÑiF�&|K����� ��º»¦�¤¥´<¤¥´�ªã©¨¢`·¿¤.#&%ƹc¦¼¬Üª�©¨ª�²�ª�¬]¤¥·�Àѵ`£�¤¥´�ª/ �At�0�Þp� m¿����Þp��|A|ÈuÑiI��|K� ��� ÃAá}À�¤¿ªj£�¢`©¨©I¬Mª�§nª�·¥·¥¢ £¥½s·¥º®¢ Ác·B¢ £¥ª�§nµA²�Ác©¨ªj¤¿ª�¶�Í ¤¥´�ª�¤Yº�µ³¹>¢ ¤¥§�´�ª�·¢ £�ª(º�£�¦�¤¿¤¿ª�¬ã¯w§nµA¢`©�ª�·�§nª�¶>±�¹c¢`§�Û¦¨¬I¤¿µ³ÉA©�µ`¹c¢`©K²�ª�²�µ`£¥½`ÃAÄ�´�ª(´�ª�¢`¶�µ`À>¤¥´�ª(ªnØ�§�´M¢`¬�É`ª8�I¾�ª�¾Mª¦¼·z·¥´M¦�À�¤¿ª�¶�¢`§j§nµ`£�¶M¦¨¬�ɳ¤¿µÆ¤¥´�ª�¬F¾M²�¹Èªj£Bµ`ÀÈ·¿º®¢ Á>·z¦¨¬Â¤¥´�ª�ÁM£¥ªj¸K¦�µA¾M·�Ác¢`·¥·#� ¤¥´�ª(¬�ªnØK¤BÁc¢ £¥¤¥¦¨§j©¨ª¹>¢ ¤¥§�´&¦¼·(µ Ód·¥ªj¤�¹I½�¤¥´�ª×¬F¾M²�¹dªj£(µ`À�­(Ì}Ï�áb¤¥´�£�ª�¢`¶M·(Ádªj£(¹c©�µK§¥ÛÈÃ

tD�����&�0�'�������)?�X��';��r�'�����R������ ��)N���'�a�)�P*���&���� ���*y���i�g��;9�� ���*~$�&$�� �?,�)�0�'��%��� e6��� �����N�)�GI�)��;,�';��oPþrþ « ­�7©�³.¬y�îJ�k?>+O�rb>������7�9�� M���*4�2��%�% ��*4N0?4�)����& ��'�)�%S��;�a���*��5\4��"���;������d�l��; �����*g�';9���l�+O*9���'�&*c�)�V�)�0�'�J�7�'�!���� �d�D���)% ��)��T���0�VN��)�'�&A�U���; �����*��';���D��&��*��'����+�*9�]�'����;�3�'�����������' ���N�����J�����'�&$+����e������b:��&����r��"# ��T��*>E}GI ��7�'�i� +O�� '�]�'������F�)�0�'��';�4�'�����H6��� �����N���,���:�����e�7�g6 �& ��)����g�';9�]����;�4�������c�+O*9������*�6�������,GM���c���*�����*��)�����GI������W-.�����y-_B��@*���� (&;�0?@��fOXC��� �0� 1I"8� 3*�5�2���)���'15A��J� ��)�%,�T���2;������'�&$+����';���'�����6�������/���S�)��� �������0�'�&*�N:?�� ����V�+O� �z����&���&����XD��;�,�'; ��T��*z;���g� N��'������&*��y6������)*���)���H���*�m\cGI;���2;$�)�H������F���h�dGe��+,�)���H+�� ��������)�eGI�)��;���;���&� � �����+�� ��*���%h���)������0�H����';�r�m\��2;���% �hb>�������AR|>����&�r��;�a�'; ��T��*~�2��%�% ���%��� ��)�2f/GM�� �f:������)?/� �=�g+O�� pE}GM�� �+N9��������XF���&+9�� '�]�'��b:����������*�)���&�4�� ��=/���)�0�2���)���*�"8� ,�T���2;�GM�� �+YAMUÙ+� ����)������9�� �?+9�����$�&� ����)��������"3;9�T6>����%¡�����2;���; �����*��'��*�&���� �������,GI;�&��;�� ��)�c��&��*�c�'����GM��+�)���P+9�� ������&���JGI�)��;W� ��r���W�';�r�m\��2;���% ��b:���������)�W�T�����h�7�P*�>����X��7�I� N��2������I��6������)*+��& dE�Ge�� �+g���)���V�)�*�5\�A�qP; �����*�D�� ��M�';����g��?>��2;� �� ��)(��&*/����*����N�����b:��&�0�'�)?������0�';������';9�]�h������*<�'�~��GM��+¡*�W���~���<+9�� ������)���lN0?<�&� �06 �� d�'�)�%y��;�c+��& dE}GM�� �+¡�)�*�5\����0�'�~����)b>���P�5\@�2;9���%��ib:��&��i���*�m\�A qP;�Pf��5?g+O� ���0�D;�& ��I�����';9���D��"��'�& D��?>��2; �� ���(����'�)� ��';�3�>���N��& e��"#�dGe��+�+��&*~+�� ��������)���H+��& MGM�� �+4�)�e���) ��T��*�?�f>���LGI�~����*,���F����&*y���P���

� �

Page 29: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

��Q����&�I"8� e��;�r���5����"l�)�*���&���I���4��;�r;��% ;��� P�:��NO�� ���*WGe�� �+��A

���=+�� �)�0�/� �@�/�';���4� +O�� ����'�)� ��c�';9���/ ��&�)?�� �£���)$�)���� ��k?>+O���,��"r+9�� '�������&�I��;9�� ���*��� ���:���� ���XO� I��;9�� ���*y$�&$� d?W����� $�)�J� +O�� ����'�)� ��I���W% �&��� �����X9�����=NO�h�&�������0�'�����C�'��';�$�&¢����)���0�g�)$+�)������0�2�]�'��������"P���+O� ��'���0�h+�� '���)���&�!����% �� ��)��;��a���zoe���iUhA��¡�N��&���)�&6 �i�';9�]�e�)�!GF� ��)*,N��i6 �& �?,NO�����&�9�&�����O�)"��rB!�°$���:��".���5�'� ��� ��F��� ������*��� M�)$+����5E$�&�0�'����%h��;9�� ��&*,����� �?c�]�'� ����P� +O�� ����'�)� ��!����;9�� �*�GM�� ���A@Ue��� $�)�P� +O�� '�]�'������!���% ����N9����$�&$� d?y�� ��g���� �����*�?y�T6���������N���a"8� aoe�3�IUµ*�&6>�)�����a��"F����+9��N������7�k?<� A7�c���*;��%�;�� &A

��è�ç:è�� ñe©�«m³_¬�ì�î���O­��móFîy%Ö�î5ë�ï5¬�³WÇ{Ö�îkª9­�ï5¬�³_¬�­]ë

�J� ��)�%���;����������+g+9�� d�'�)�����&�l�� ��M ��T��*~-8���S�3���0�����������&*�".����;�)� ��1C����N���'�2;�&�V���0���J���>�T���-.+O�� C�';� ��T��*�1Y ���%��������� ���"8 �� j�';��H�&� � �����+�� ��*���%iN�)���)����;�!% ����N9��� +9�� ��'�)���)�D�� � ��T? ALU���)�% ���Foe���iU��'; ��T��*hN���>�2fa������������% ����*h���J�i�����)�:���������'�& ��]�T���2;S�����)�:���r�';�F���������'�& ��)���������% ����*r�'�����h�&���&$�&�:���)�S�P��;�� ��&*S����� �?r�J�&����7�k?r�J��+O� ���)�'�)� �r�� � '�T? ALtD���&$�&�0�'���"!�';�)�a�� � '�T?=�&� ��������J��"!�kGM�Wb:�9��* ��+�)���a��"H ������l�:�SN��& ��a���� � ��&��+O� �*�)�%,�'�,��;�6�������S��"!�';�g*�&����7�k?["8���5�'�)� �<���a�����2;¡�&���)��^ �J���)% ;0�J6 �& ��'�)���&��ACU�"����� r�/��; �����*<;9��� �����*��)�'�h��� � ��&�:��+9�� ��'�)���)�/�)�S*�&���� �$�)����S��;�4+9�� d�'�)������^`�h���&���e�)�*�5\u���*z*���+O� ���7�'��)�����&� �0�' ���N������� ���'�<�';��y�&�����e6��� d�'���&���&AFU��$�';��y+ ��@�&�����$��"J*��+O� ���7�'�)� �����c�T�� � ��)��*� ���hN0?<��� ��&� � ����0����; �����*���)�����r+ �� ��c�'�=����� d?���� �)���)��������a���*¡/�T?� ���b:��) �����)���)�'����&� ��P�+O*9�������P�'�c���)������0�'�I�)�W��;���J������)�k?W�J�&+������)����� �,�� � ���?�A

q��a*��T���>GI�)�';���;������������P�)�S�';�e��N���&����I��"O�]�'� ����F��;9�� ���*g����� �?�� +O�� ����'�)� ���� ��/�T?$�����'���+��H�'�S��++�7?g�';�i�'; ��T��*/�'��% % �)�%r�' ��)�2fg"8 �� É|@�&�&�'�)� ��-.·�A ¥ A)��15A>¨���GF�&6 �& �X�';�r*�7QR�& ��&�����;�� ��h�)�e�';9�]�i��;���+�*���'�&*yb:�9���0���)�'�)���i�� ��rÒ�0���'�)�%c+������0�I�:��NO�� ��&AÆJ��W� +��'�)� �z�'��% �&�$�� �� ��*��';����c���g�'�����������W�';9������<�kGF��+9�� d�'�)�����&��GI�)��;�����Ge�� �+@E}����(&��*[N���'�2;=GI�)���C;9�T6��S�5\����5�'�7?~��;�S������h�&� �0�' ��)N������� �W�'���';�����&���C6 �& ��'�)���&��A

���

Page 30: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

n}"r�';�)�4���/��;�[�T�������';�&�£�';���&� �0�' ��)N������� ��6����)����,��;������&�)6����4�T���wNO�������*w������)b>����+9�� d�'���&������*�&�0�'�)��� ��J���*=��;���'��$�h+ ��>���&���a��"!�)��� �������0�2�����+O*9�������%$�T���N��r��++���)��*YA>U3�����';�& e� +������ �4�)�F���g����a�';��r�S���������P����% ���)�9�����0�PN�)���e���$�';�JÒ9� ���'�)�%+������0�I ��&+ ��&�����0�'���'�)� �y��"l�';����&� �0�' ���N������� �46����)��J"8� e�';� ��T��*~�'��% % �)�%~-_���I� +�+�� ����*�'�/��;�c�$�� �d�3����% ��7�9�T���:�3N�)����"8� i�';�S���0�'�&% �� ��T������15A�qP;�������[�5QR�&�&�a ���*�������J��;�Ò9�0�������%y+������0�S+� ����&������� ���'�����LEkN�7�'�&X#GI;����2;u*�&+��&�*�)�%�� �¡��;�4��+�+���)�T������� �<$��?N��r�&� $+����2������� ������7?c����¢����)���0�TA

���&�)�';��� M��"Y�';�&���a��++ �� ���2;���P�)�F�)*�T����X:���7�';� ��% ;$��;�a��������+��'�)� �/�)�$��;��"8� �$�& F�)� '����;�� r����@Ek ������� ��)�&�'�76 ���C����$� �d�r�T���������';�c+ �� N9��N�)���7�k?y"8� ��W ��&+������'�&*�+9���) a��������&b>������&�J��" ¥ �JÒ9�0�]�'����%�+O� �)�:�H�:��NO�� ��F*� '�TGI�/"8 ���õ���&��� ���i���h����)"8� �µ*�)���' ���N�>E�'�)� �g���V6>�� d�'�9�����)?�(&�� ���A qP;���D�)�V�';�I��++ �� ���2;�GF�P�2��f��I���g� � V�����d�F�)$+���������0�'���'�)� �YAoM������ ��7? X@��;�r�T6���������N���)�)�k?g��"l;9�� �*�GM�� ��r���++O� �����*~��;9�� ���*W����� �?/���'��$�)�3� +O�� ��]E�'�)� ��eGF� ���*~NO�r��;�)% ;�7?/*�&���) '��N�)�J"8�T����� ��r�)�W"8�@�'� ��Soe���iU¤*�56>�����&��A

��èÛ� 1 ¬�î5«�©�«'ì2´>¬�ì�©��ñe©�«m³.¬�ì�î�ÍI¬�ë9ë9¬�ë@�

qP;�a ��&���� ����5�'�)� ��e�)$+O� ���&*,N0?/��;�a���)$�7�'��*$���� ��0�P��"���;9�� ��&*W$�&$� d?�+��& e���7�'�7E+ ��>���&����� �-8+ ��&���&�:���)?���· Ür�P1M;��6������~���+9���5�I� �W�';�Soe�3�IU��)$+���������0�'���'�)� �,��"�';��Bl�� ��'�)���)���F�����)�%r������+YA:nk��& ��T��������%h�';����:��NO�� H��"��'; ��T��*�H+O�� HN���>�2f�NO����5��'�+��& �"8� �/������rN�������I��;�h������r������a*�����������;����M��;�S��$� ���:�I��"D�T6���������N���3��;9�� ���*$�&$�� �?c+O�� F��; �����*,N�)�@�2f�A�ÆJ+��'�)/����+O�� d"8� �$����&�i"8� H�';�3Bl�� d�'�)�����mEkq���EdoM�&�����J�&�@E���7�k?4�J��+O� ���)�'�)� �,�d�'��+W�)�P���2;�)�&6 �&*=�]�P���&���Y�&����d�'�� P����(&�a��"�· ± ���)�,�';� ¥ Ek*�)$�&����)� �9����T�����3�';����H$������F��;9���H�';��+ ��>*��5�e��"R�kGM�g��"R�';��% ��)*Y^`�H*�)$�&����)� ��H;9���F���SNO�J· ± X�'�>�W��$�����l"8�� a+ '���5�'�)�T���V+�� �+O� ���&��A�q��y��**� ���������;���r�)�������cGF�����+���&$�&�:�a�~;�)�� pE�� ��2;����T����6 �& ������ �<��"!�';��cBl�� d�'���&���S�M��������%4����% � ��)��;¦���*���*]K������J��;�g��*�& ��7?@�)�%+9�� d�'���&���a���*y�&���)�Y*9���'���d�' ����&�'�� ��������&��� �*���%��)? A

���

Page 31: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

ÊB¦�É�ÃIË2ÐKÃ(°Z©¨©¨¾c·¿¤¿£�¢ ¤¥¦�µA¬Ùµ`Às¤¥´�ª)·¿Ác¢ ¤¥¦¼¢`©�¶Mª�§nµA²�ÁdµA·¥¦�¤¥¦�µA¬ ¢`¬M¶%¤¥´�ª)¢`·¥·¿µK§j¦¨¢ ¤¿ª�¶ ²�ª�²�µ`£¥½©¼¢�½`µA¾�¤�Àѵ`£B´M¦�ªj£�¢ £�§�´M¦¼§j¢`©A¹c¦¨¬c·jÃ�â}¾c²s¹dªj£¥ª�¶s¹Èµ�ØFª�·�¦¨¬M¶c¦¨§j¢ ¤¿ªp§nª�©¨©I§j©¨¾M·¿¤¿ªj£�·Tª�¢`§�´Õ§nµA¬I¤¥¢`¦¨¬M¦¨¬MÉ¢�¹c¦¨¬�µ`À�Ác¢ £¥¤¥¦¨§j©�ª�·�ÃM¡�¢ £�¤¥¦¨§j©�ª�·(º»¦¨¤¥´M¦¨¬�¢�¹c¦¨¬�§j¢`¬&¹Èª×¦¼¬y¢ £¥¹c¦�¤¿£�¢ £�½'µ`£�¶�ªj£�Ã

qP;��/���)����*���4���J�'�W�' ��T���r��;�c+9�� ������&����N�)������r������6�������"M�~+O� ���0���� dE}���&���aN�)�9�� �?��+9�����S+�� ����)�'�)� ��-_�e|�BH1P�� �����AO¨����& '�� ��2;�������YN�)���)�%c���I�T�� � ��)��*~� ���iN0?y+O�� d"8� ������%+9�� d�'���&���g*�mE}"8 ���% ����0�2������� �<���*��m\��2;���% �/��$���%4�';�c�kGM�yN '����2;���h��"H�';�c�' �������������2;���>*�/�d�2�� d�'����%="8 �� ��;�, ��>����A�qP;�)�S+ ��@�&�����g���S����������� a���u��+�� ��)���'�=��;� ��&��� ����)6��M+9�� ��'�7�'�)� �����%P+��& �"8� �$�&*S���r�';��F�&���������������32J����2f:���� ��l����% �� ��)��;~X0-�oM�� ������&�S����A7X���� �@�L15�Y��;�/$�����<*�7QR�& ��&����&���� �����;9���h;�� ��$�' ����c�' ���6��� ��'���H����+9�� d�'�����!���*N �����*���;��9 ������C�������W+�)6����a6�������&�r�� ����@\��&*¡�)����*�6�����&�c���*�����&*¡����rN��g+9�� ��r��"�';�S��� d�'��*<����b:����������&A#U3�����)����d�' ����'�)� �y��"D�';�g;�)�� ��� ��2;�)�T����N�)������%,���)% � ��7�';Ö�)�% �)6����~���~§l�)%AC-p� �L1

ÊB¦�É�Ã�Ë�Ë Ã:Þ�¦¨¬c·®¢ £�ªÆ©¼¢`¦¨¶�µA¾�¤(¦¨¬�²�ª�²�µ`£¥½�·¿µÕ¤¥´M¢ ¤�¶�ªn«vÀ�£�¢ ÉA²�ª�¬I¤¥¢ ¤¥¦�µA¬ã§j¢`¬�¹dªÆÁȪj£�Àѵ`£�²�ª�¶´c¦�ªj£�¢ £�§�´M¦¨§j¢`©¨©�½`ÃzÄT£�¢�¸`ªj£�·¥¦¨¬�É)¤¥´�ªcÞ�ÊK¡ ¤¿£¥ªjªy¤¥¢ Û`ª�·54�¯7698;:=<>�±�Í�º»´�ªj£�ª?>9¦¨·Õ¤¥´�ªã¤¿µ`¤¥¢`©¬F¾M²�¹dªj£�µ`ÀT¹>¦¨¬M·jÃ�Ä�´�ª×©¨ª�¢�¸`ª�·�µ`ÀB¤¥´�ª³¤¿£�ªjªs§nµA¬]¤¥¢`¦¼¬&¾M¬M·¥µ`£¥¤¿ª�¶yÁc¢ £¥¤¥¦¼§j©�ª³·¿ª��I¾Mª�¬M§nª�·

qP;���i���)% � ��)�';� ;���P�kGM��/�����4NO����5��'�&�

¿ �7�,*�>�����Y^ �y���������<���0?:�';�)�%���NO� ���,��;��+9�� d�'���&���[*@?@���$�)���W����*w��+��&���7�9�T���)�)?��NO� ���I;��LG°".�� P+9�� d�'�)�����&�P* ��7"��P�T���2;y�'�)$�3���'�&+Y�

¥ �

Page 32: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

¿ �7�P+9�� ������)�����)(��&�FGF�����H-ÔK�����i�)��f��@2J��)�2f:��� d�m15A

U3�����������XH;��LGF�&6��� &XF�)���';9���c��;�W�>���N��& c��"a���)����GM��N���$�'; ��T��*�N���>�2f:�c���c����G�������56 ���)�e���)� ���J�����';�3 ��>���P��"#�';��a�P|�B�+9�� ������&���3N����,�' ������9���P�)�&6 �&�k½$�';��� ��a�����WN��J���$�����J� �A� , ��; �����*[N�)�@�2f:����������2;��*[��������)�2������ �����)?�A���)��;=+9�� ������)���C�m\��&��������� �[������56 ��� ½�X��;���>���N��& ���"V���)������0�2�� �?4� +O�� ����'�)� ��P+O�� I�'; ��T��*yN���>�2f,�)��¼?B�� �A� , ���*�';:��I�';�r�m\�+O���5�'�&*=+9�� ������)�����5\@���&���'�)� �~������J���I+ �� +O� ������ �9���O���

¼u- �� þ �� å þ 3�3�3 þ �

� �A� , 1 ú ¼u-p�}a �� �A� å 1 - ± 1

GI;���2;DC ¼ "8� y���� �% ���&�� �%�; ½�A3n}"�;�)�� '�� ��2;�)�T����N��������%����=+O�� d"8� ����*®��6��� � ¥ Ek*�)$�&����)� �9���I*��/���)�YX!�';�)�4N�� ���*��T����NO�����+ ���6 �&*£N0?��9 ��d�W ��������%�*�mE"8 '��%�$�&�:�'���'�)� �=�)��+9�� ������)���CGI�)��;� �����+��&�&�r�'�4��� ���������N[+9�� d�'�7�'��������%[-_���3� ���'�)����&*���[|@���5�'������-��@A ± 1mAOqP;����[GI�)��;���y�T���2;=������N= ����<�,�LE}*����������� ����C;���& '�� ��2;�������#N���>E�����%y�)��+�� '���)���&�l"8� ������l������N��ACqP;�)�h%��)6 �&�h+�� '���)���&�l�5\@�&��������� ���'����g+ �� +��� ��'�)� �9����'�� ¼

M þ ¼M - �� þ �

� å þ 3�3�3 þ �� ��� , 1�1EC®� ¼ M -_� 1

GI;�� �� M ���e��;�r�>���N��& I��"l������N���A

§9� c����d�2����&��XD� ����*�� /�����z��"3����(&�VÝ%ó ÿ ÝGF ÿ ÝIH/GF�y�)*���0���)"�?z������N�gGI�7�';��kGM�*��������������9�������)�����&�P���)� �%��h���>� �*�)�9�����J�]\@���&X�����?9J�X9���*,�';:�� M ú ÝIH�A:���3���&�I�&���)����)������� �������;9�T6 �W���)(��W· ± -8*��,������;9�� ���*�$�&$�� �?����)$�7�2������� ��r� �@�'���)���*u��N���6���1���*��&� ����&b:����0�'�7?[�';��� ����� ��{Ý%ó ÿ ÝGFKB�· ±

ú� � ���&�������������'�& ��a+O�� �������NYARqP;�& ��c�� ��

½Yþ,�F*��5E}"8 ���% ����0�2�]�'�����h+9�������&���]�';�!�9 ��d�V� ���HGI�7�';RÝGHl�';� ��T��*SN�)�@�2f:������ ���+9�� ��'�7�'�)� �N��5�kGM�&������*]K����&���0�r������N�����';�g��m\>�{½yGI�7�';�ÝIH5� X �'; ��T��*<N�)�@�2f:�a�����2;YXD� j È j ½OX�'�c+O�� �"8�� �ä;�)�� ��� ��2;�)�T���RN��������%c���I�)�&6���� È�XGI�7�';�)�W�T���2;~������NYA

���r�&$+;�����)(��a�';9�]�i��;�r���d�'��$�������I% �)6����~���~tDb�Al-_� 1P���*ytDbOA�- ± 1P�� ��a��;��� ��&�����T���

¥ �

Page 33: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

N��&�����T�����������&�9�� ���� �&A�nk��+ ����&��������XC�)"�½����J�'�>�W���� �% ��X��';�g�'�& ���r��"M��;�c% ��� ��&�� ��)����&b>������&�[���xtDbOA3-���1c�� ��~�5\@+��&�&����*������'�]�'� ����'�W"8� c��� ��V½"Þ j ½/þµ� ADqP;�)�$�)�*��g�'�,".���&�a�';�������r����$���)�&6����D��"H�';�c�e|�Bj+9�� d�'�)�����hN������ �������;�� ��gGI����������aNO�������% ;W�T6���������N���P��; �����*4N���>�2f:�F"8� F��� ����� � ����0�I�m\��&��������� �W���*,�';�3f��� ������GM� ����* ���~�����% �� e��;9���4�';����)*�T��� Á,-W¼?B � �MLN� , 1e�������A

O ¿J»MýL½ZþÇý]Â���û�� » �,» \ �ì��ü \

���h*����������3�';���+��& �"8� �/���������"!� � 3����%�� ��7�';��P� �=6��� ���� ��I�'�&���3�T���������&���9�� ���� �&A���3��� �����*�& F��;�aBD ��&+ ��>���&�����)�%�|>����+W���*$�';�aB��� ������&�����J������)�k?/�J��+O� ���7�'�����,|>����+���&+9�� '�]�'���7?����u�';���$��;�[�5QR�&�&�4��"J��� d�'����%�NO�=����� ���]�'��*RA!�¡�=�)�T�T6 �=� ���/��;��oM�&����Eq��]E}�!�� d�'�m\��d�'�&+�GI;� ���=�5\@���&���'�)� ���'�)$�W*�&+��&�*�,����)?�� �x�';�y% ��)*����)(��y���*��)� ��&�������)6 �&�)?y��$�����_�O"8�� J�5\����+����XR�7�a���g���4���*�·W����)���)�����&� �*�I"8� a% ���*�3��"M����(&�c· ± æ���* ¥ �]æD �����+��&�&���)6 �&�)?�A qP;�e�'�&�����D;9�T6 �IN��&���g+O�� d"8� ����*g� �c�J�@AÔ· � ��¨i(P· ± E}N�)��b:�9��*��� ��gnk�0�'���l+ ��>���&������ a����)�%,nk�0�'�&��^ �r§��� ��' ����u���@A)�g�&� $+������& i"8�� ��';���oeBH�{6��� ��������YX���*c�I�Jnp�JnkUS^ �Hoe�3�IU®� A7� µ@¡%§N§ "8� l�';��I��B!�x6��� �����������"O��;�e�&�@*��A qP;�P�d�2���*�� �*P�Q ��� �+�)���� M� +��'�)$�)(T������� �$� +������ �,GM���i����&*~���$�&� $+�������N����';W6 �� ����)� ���A

¿'ý]»:ÃpýAþC� » \�\ �lû�ÄSRTü�»:à ��������$+9�� ��r�';�h�5\@���&���'�)� �=�'�)$�&�I��"D+9�� d�'�)�����rN�)���)�%6 �& ������e"8����9��� ������%X:NO���';$+��& �"8� �$�&*/� �$�';�J��B!�hA>ÕI������)���e�� ��3��;��LGI�4���,§l�)%A9�L�"8� P% ���*W���)(��a��"l· ± æ ���*~���&���Y�&����d�'�� I����(��r��"l· ± A

¿��dý`üL�_� �8»"!#�}þ$!5áh»@�Ô�+RTü�»:à qP;�~Bl�� d�'�)�����mEkq���EdoM�&���H������+�;9���gNO�������)$+�)������0�'�&*� ����;�<oeB!�Ó������%���;�[B��� ������&���[BD���;£$�5�';�>*�N�@�4�����������%������� ��'�&*£���+����+9�� d�'���&���P�� � '�T?�A0qP;���D�)$+ ���6 ���!����% ��7�9�T���:���)?�oeB!�������2;�i��� ;��� ��&��&?����*$ �������)���D���¥ Ed�r�'������M��+O����*��+W�L6��� P�';��J��� +@�'�����(&��*WoeB!�j6��� ������ �RAqP;��oeB!�j�'�)$�&�M��;��LGI�

¥ �

Page 34: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

B��� ��������)��� §������C|>� ������% �M��������% Õ��]�'����LZ ���L�@A`· �@AÔ� ����A ¥� Z ��� ¥ AÔ� ��A � �L�@A`�± Z ¥ �@� A`� ����A ¥ ����AÔ��0Z ��� ��A`� ¥ �@A`� ����A`���·0Z � ± �0�@AÔ� � ¥ AÔ� ����A ±

ÊB¦�É�Ã�ËmÏFÃI¡�ªj£¥À�µ`£�²�¢`¬M§nª�§nµA²�Ác¢ £�¦¨·¥µA¬�µ`ÀdµA¾�£pÁ>¢ £¥¤¥¦¨§j©�ª�¹>¦¨¬M¬M¦¨¬MÉ�¢`©�É`µ`£�¦�¤¥´M² ¢ ÉA¢`¦¨¬c·¿¤pÀw¾M©¨©�·¿µ`£�¤Z«¦¨¬MÉ�ÃÈ¡B¢ £¥¤¥¦¨§j©¨ª�·�¬F¾M²�¹dªj£�·»¢ £¥ªÕÉA¦�¸`ª�¬#¦¨¬*Ádµ�º®ªj£�·�µ`À�ÏFÍ�¦�à ª`ÃYË�Î ï�Ë2Ð�Ù]Ý6âLÑ�íFÃOÊM¾M©¼©T·¿µ`£�¤¥¦¨¬�É�¦¨·§j¢ £¥£�¦�ª�¶&µA¾M¤}¾M·¥¦¼¬�É�¤¥´�ª�­�Ì�Ï�á ÏÆ¢ ¤¥¢�¡�¢ £�¢`©¨©�ª�©�¡�£�¦¨²'¦�¤¥¦�¸`ª�·�©¨¦¨¹M£�¢ £¥½)¯v­�Ì�Ï�¡�¡®±�£�¢`¶M¦RØã·¿µ`£�¤Àw¾M¬M§n¤¥¦�µA¬ÇÃ"��ØFª�§j¾M¤¥¦�µA¬y¤¥¦¨²�ª�·»¢ £¥ªs²�ª�¢`·¥¾M£¥ª�¶ã¦¨¬y²�¦¼©¨©¨¦¨·¿ª�§nµA¬c¶M·� �y§l��%A�� ¥ ���*�� ± ��� � �����+����*~������;� × ���� ��'�&*Øc6 �� ����)� �YX9������� ����%c�';9�]��NO����;W��;���B!�����*y��;�goeB!�{�)$+���������0�'���'�)� ��I�� ��h�&� $+�� ��&*����I".���� ��)?W����+��������)N����A�qeGM�� N���� �6�������� ������ ��a������*�����'�&�)?$��++9�� ����0���

¿ ��;9�����5\@���&���'�)� �¡��������r���������gGI�7�';<�';���:��NO�� ���"e+9�� ��'�)���)�����C�)������� ��7?="8� hoeB!�����*y������ ���P�)������� ��7?$"8�� i��B!�

¿ ��;9���4�';��uoeB!�JÈ���B!� �'����[ ����'�)��*���+O���*�y� ��7?�� ���';�¡�T6 �& '��% ���:��NO�� W��"+9�� ��'�)���)���e+O�� I���&���

§9� ���;�� �$� ���X0�';������a �������)���M+ ��L6>�)*�J���/����&� � '��% ���%h����7�'�����NO����2;$�� �f���;9���e���@E��b:��76 �>�T���)�)?hK���d�'�7�9���I�';�r"8�T������N������7�k?,��"l*�&6����)� +����%/;�)% ;y+O�� d"8� �$����&��B!ndoj�&�@*����� �W�';�h�rBH��A

T á3þÅû�� �.� \ �lþÅû

���/;9�T6 �4% �76 �������z�L6��� d6@�)�&G���"iBl�� d�'�)�����mEkq���Ed�a ��)*¡�)�0�'�� �+������������ ��������;�,�&� �0�'�5\>���"I+������$�[BDndoµ����S���������� ����AC���/;9�T6 �4*�)�����������&*z�';�,+O�������0�'�����F�)��������g�)�:6�� �)6���*���$���+���&$�&�:�����%�B��� ��������)�5E}q���Ep�r ���*c���0���� �+O� �����'�)� �c� �/�';��a�rBH�°���*/GF�J;9�T6��J+ ��mE���&�:����*W�r".�����M+9�� '�������&�9���)% � ��7�';Å�';9�]�e$��+�H�&¢����)���0�'�7?c� �Woe�3�IUj+�������"8� ����A��¡�

¥ ¥

Page 35: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

���SN��& i��"VB��� ��������)��� qP�)$�)�% �q����2��� B��� �oM���)� oeB!� �rB!� Õi���'�)�����· Ü � �L�@A`� ��AÔ� ���@A ±�>�L��Ü �T· � �@A7� � A ¥ �L�>A)��LZ ¥ � ± � A ± �@A`· �L�>AÔ�� Z · ± � �@A ¥ �@A ¥ � ± AÔ·± Z ����� � ± ��A`� ����A`� � ¥ AÔ·�0Z ����· ��� ·�A ¥ � ± A7� �L�>A ¥��·0Z �>�L� ��� ��A ± ����A`� � ��AÔ·

ÊB¦�É�Ã�Ë��Fà ¡�ªj£¥À�µ`£�²�¢`¬c§nª®§nµA²�Á>¢ £�¦¨·¿µA¬sµ`À�¤¥´�ª®¡B¢ £¥¤¥¦¼§j©�ªn«lÄŵ «X­�ª�©¨©]·¿¤¿ªjÁÕÀ�µ`£TÉ`£�¦¨¶×·¥¦��jªË��ÏIU»��ÏGU»��Ï¢`¬M¶3¸ ¢ £¥½F¦¼¬�És¬F¾M²s¹dªj£®µ`À�Ác¢ £¥¤¥¦¨§j©¨ª�·jÃI¡B¢ £¥¤¥¦¨§j©¨ª�·�¬F¾M²�¹Èªj£�·p¢ £¥ª�ÉA¦�¸`ª�¬�¦¨¬�Ádµ�º�ªj£�·�µ`À�ÏFÍK¦�à ª`ÃËAVï¤Ë2ÐLÏ^Ù �RË�Î ï¤Ë2Ð�Ù]Ý6âLÑ�íFÃdÄ»´�ªs¬F¾M²s¹dªj£�µ`ÀBÁc¢ £�¤¥¦¨§j©�ª�·�Ádªj£»§nª�©¼©Ç¦¨·(¤¥´�ªÂ¢�¸`ªj£�¢ É`ª`Ã$��ØFª�§j¾�¤¥¦¨µA¬¤¥¦¨²�ª�·�¢ £¥ªs²�ª�¢`·�¾�£¥ª�¶ã¦¨¬y²'¦¨©¨©¨¦¨·¥ª�§nµA¬M¶M·

���SN��& i��"VB��� ��������)��� qP�)$�)�% �q����2��� B��� �oM���)� oeB!� �rB!� Õi���'�)��LZ ± ·0�@A`� ¥ AÔ� �@��A �� Z � ��� ± AÔ� �@AÔ� ���@AÔ�± Z �T· �L����A`� ����A ¥ �L�>A ±�0Z ¥ � ¥ � ± A ¥ ����A ¥ �L�>AÔ���·0Z · ± ·��L�@AÔ� ± �@A ¥ � ± AÔ·

ÊB¦�É�Ã]Ë0Ù�Ã�¡Tªj£�Àѵ`£�²'¢`¬M§nªp§nµA²�Ác¢ £�¦¨·¿µA¬Æµ`ÀK¤¥´�ª�¡B¢ £¥¤¥¦¨§j©�ªn«lÄTµ «X­®ª�©¨©]·¿¤¿ªjÁsÀ�µ`£ÇÉ`£�¦¨¶³·�¦��jª�·%í^ÙWUìí^ÙWUìí^ÙA;9�T6 �¡*���� ��d�' '�]�'��*w��������)*�� ���N���<��+��&��*�+j�L6��� ~��b:��76��������0���)?���+��'�)$�)(���*°oeB!����+���&$�&�0�2������� �YA

U3�P"8����� ��JGF� �f$GM�r���06>������� �W�)���� �+��� '�������%��';�hoe�3�IU¤���&�����)�� ����'�&*yB��� ������&���5E}q��]E�r ���*��&� $+O� ��&�0�r���0�'�~�,"8����7?y"8����&����� �9���!��B!�µN9������*�BDndoÅ���>*��ACqeGM�~���&+9�� '�]�'�6 �& ����)� ��i��"�����2;=���&�@*��X9� ��a"8��)�)?$f>�)��&������X9���*W�';�r����;�� I ���*��&��*[%�?@ ���Ekf:�)��&������X�� ��I�&� � ����0�'�7?c��*�& F*�56 �&��� +����0�!GI�)��;���c� �� H ������T�� ��2;,% ����+YA>oe�� ��&"8��9�)�:6����d�'��% �]E�'�)� �W���*WNO����2;$�� �f>�)�%c��"#�';�a�)$+���&�P��"��&���)�Y���)������� P% �&� $�5�' d?4���*W����(��a���W��;�+��& �"8� �/������e��"9�';�I¨i���� ��� ��2;����T����B��� ��������)�P�M�)������%3������+c���V�������J������ �*�& �A U��g��������

¥ ±

Page 36: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

��"�+9�� ����� ��0�l�)$+O� d�2����&�F�)��;��LGxBDndou���>*����GM� ����*����T���)�M�����3;0?@N� ���*S*���d�' ��)N������*��B!�õ���06>�� �� �����0�TX#��A`%A��W���)������� ���"I�rB!�v�&�9��N�)��*����7�'�7E}��� ��g��� �+�����c��@*����GI;�� ��g��&�kGF� �f[��� ��������T�]�'�����~GI�)����N��&��� ��S�';���*� ����9���:�3N������'�)����&�2f�A#|@��2;��$�)% '�]�'�����$GF� ���*WNO�a��)����$���'�&�)?c��&���&���'�� �?W�)"� ��T���)���������������7?g���)(���*~BDndow���������������� ����;�����*4�9�*~�';�&�� eGM�T?4���0�'�g��;�r/���)����� ��������"V�rBH�®�&� $+����'�)�%A

³���zû�þ@¼P�8»>ÿ#Ä�»>Â�»cûTü \ �¡�VGM� ����*r���)f��l���e�';9����faÕ���/�������J� ������dGe��$�_X&U�$�7�2��N;

�H�� ���;��5? X@Z=�� ��i|>GI����*9��f�X0nk�% $�� D�M ��@�&$�d�' ��+YX0����*/�J�& ���fYX��N9�a"8� V;�&��+�"8���*���pE��������)� ������*<����% % ���d�'�)� ��r*� ����%,��;�g*�&6����)� +����0��+;9��������"F��� JGM�� �f�AY������ ��% '�]�'�&"8���R�'�c�';�r+9��+��& P ��&"8�& ��&���I"8� e�';�&�� I*�5�2���)����*4�&� �$�&�:���i���*W���%�% ���d�'�������A

�,»:½}»MýL»>û�� » \��A`�J���5?@f�X�|@f��&���5�'� �4BDndo��&�@*�&�F"8� !+9�� '���)��������� �+������ ��&XoM��$+�@�'�� FBD;0?@�����&�IoM� gE

�����������'�)� ��P�0�W-p�h���*[��1a-d��� � � 1M�0� Z>� ± AÜgAR�M��GF�� ���XYU������&���& '�������%/�/+9�� d�'���&���mEk���>Ek���&���Y���������������� �W������%4�$;:?>N ���*[�&� ��0�'�)�%��� ���XWX�� � ��9���C��"VoM� �+���2�]�'�����9���YBD;0?>���)�����L� ¥ -��������L1 ¥ � ¥ Z ± � �:-p���01mA

��A9qP��f:;9��f]�T?0�@XRÕrA�|@�2;��&��*�& �X�ÆJ+��'�)$�)(T������� �,��"V+�)���&�@*����iN:?W�)$+� ���6 �&*=����� �?$���9��%�������0�TX�X�AOoM� $+����TA�BD;0?>��A�� � �W-d��1a-���� � � 1e�0����Z>� ¥ ��A

��A@BD �(��&N����*9��X[X�Aoe�� d? X�|@� ��3�)$+ ���6 ������0���F�)�,BDndo�+��& �"8� �/�������I�'; �� �% ;,��� ��dE�)�%X������2;�)�%X����*~*�?>�9������a�)�0��*4N9��������&���%�X�����)6 �& ����)�k?4��"VoM� �)� '��*��=-_��� �0��15A

qaAH|@� ���������YX!qaAH|@�2;9���&QO�'�� &XHÜcAV���>��XHZ¡A!¨�������&�YX!U3�&�����)�� ����'�)�%[�';�W������b:��)�dE+9������*g".���d�V"8� � ����& l�' ������"8�� �{���g��� �$�>*�7�k?h%� '��+;������l;9�� �*@Ge�� ���X0npt!t!t¡q� '�����dE���5�'�)� ��P� �yZy�&��*�����Cnk/��% ���%����~- ± 1a-���� � �01e� ¥ ��Z�� ± �@A

�cA�|>�'���0�'�2;�56OXC��A\X���N9��X��¤AR�J� �������*YX9USA��H�� ���;��5? XY¨i��% ;>Ek+O�� �"8�� �$������r�&� $+��@E

¥ �

Page 37: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

�'���'�)� �����*�6@�)���9������(����'�)� �z��"3+������/�[��� �N�����������~� �x%� '��+;�������+ ��@�&������� ��&XFq��U�++����� P���yoM� �+�������%c�)�~|@���)����&�S����*=tD�% �)����& ��)�%A

�hA��a���� ���6OXgÕrAg�J� ������dGe�����X��¤Ag�J� ������*RXgZy�)**���5Ge�� ��£"8� z+ �� % '��$����%�I�Jnp�JnkUÅ�rBH�i�P"8 �� Ö§9� d�' ����W�]\�XO|@�+O�� ���� �+�������%W^`�0�@X9ÕI�����X��i��-������0� 15A

X�AetPAI|>��� ���X]X�AIo3AMB!;������)��+�&XHB�AesDAP§9 ���**���������XH��A^X�AP¨��� �*@? XesDAe�cAFq� ���N��&�XÜgAM|@�2;:��)�����YXFU3���&���)�� '�]�'����%u$�������&����� ���>*���)���%¡��++�)�������'�)� ��gGI�)��;�% '��+;���&�+ ��@�&������� ���X&X���� ��9���R��"�oM��$+�@�2������� �9���RoM;���������� �?/���4-p��·01�-���� � � 1F��·�����Z���· ± ��A

sDA,�i?>�����*YX/�IEkNO�>*�?����ä�';�Å�rB!�hX/U����� ��:�rB!� oM� ��"8�� �����&��XWBD ��)����5�'� �RX,�(X-.����6 �&�N��& ���� �0� 1mA

�i�3np�JnkU{oM�� �+O� '������� �RX�i�3np�JnkU�oe�3�IU�BD �� % '��$����%g�r��)*�c-_��� �0� 1mA|�AR|>�'� ����XY¨�AW_J��X9�¤AO$�&�l¨IGI�YX`X�A�¨3���)*9�� &X���AY|@�@���'���YX\alA EpB�ARsC�����%XO¨���G��rB!��������W���+ ���6 �a��;�rb>������7�k?,��"�/��% ��&�����J ������ �9����&�h�)/��% ���%,-�ÆJ�&��� NO�� ���� �0��15A��Õ�s �_¥N¥ �^b­�@��øNøNødc�û�¦'û_·�¨@§�·_¸"¢Ecd�I£Nû-�I���Nñ%¨@��e�e f[gEch�_¥��%¸

��A�sC���N�f���X]qP;�H*����>�� '�]�'��(����'�)� �J��"�+9�� ������)�����&� �+���'�)�%XTU����� ��:�rB!�xoM����"8�� �����&��XBD ��)����5�'� �RX9�(Xy-_����6����NO�� 3��� �0��15A

Z¡A]¨3�� � ��)��X�X�A�ÆJGF������X�|�A�|@���%��+��2�@X�_�AiaR;���%X�UhA��a�T6>��*���� �YX�oe���iU�*9���'�i+9�� '���)�����+ �����)���)6 �&�M�)��N ��� �?[-������0� 15A��Õ�s �_¥N¥ �^b­�@��øNøNødc�û"�_û"���]c­�I£Nû-��ù_¢�¡�¢-¸N�'�-¢N£-�@§ �-ù"�N�%�

�¤A#¨iGI�YX���ACÜa�) �f�XCBD �� %� '���$�)�%,$�������)6����)?=+9�� ������)���l+� ��>��������� ���X�����76 �& ����7�k?���"nk�)������� ���F���i�� �N9���9�LEdoM;9���+9���)% ��-���� �0� 1mA��Õ�s �_¥N¥ �^b­�@�@§ ���_£�¨�¢�¨jc°¢-§�¢Ech�¶¦ �%§jc°¢Nù���"¢$§�¢k3lnm��"·�¸&eI�_¦6µ�ù_¢odcN�@¥�¶¸

X�A���AlÆ3GF����&XDZ¡A�¨i� ������ �YX���A#sC���Nf���XV|�A��r ������RXpX�A�tPAV|:�'� ���XqX�Alo3A�BD;���)���)+��X�rB!����� �+�������%XB! ��@�&���&*���%��i��"���;�rnptHt!t£� ·~-_� 15A

o3AVÜgAV�F�� �*��'���)��X#USAl�3AVs#���%�*� �YXlB!������$�[BD;0?>�����&���J����oM� �+���'�& c|@�)�����]�'�������XZy�T�r ��TGeEp¨��)���_X@nk���A)X��i�&Gr_H�� �f�X��s_�X9�J|@UhX#��� �0�@A

��A�B��@*�)� (�;��:?>�f�XO¨��)����� % '����T����������������� �,�)�~oe�3�IUä-_��� �0��15A��Õ�s �@¥@¥ �^b­�N�IøNøNødcÔµ_¡%¦'ù�¦I·$cd§ � �%�@�'ñ&tN¢-§'¥��@§��_ù�· ¨�·��_��¸"¢ ù_·�¥�·n�I�-·"£_·�¸N¸"¢_¸pcN�@¥�%¸

¥ ·

Page 38: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

qaAR¨�A�oM� �����YX�o3A�tPA�sC�&�����& ���� �YX�Õ�AOsDAOÕi�76 ���d�TX�o3AR|>�'�&���YX�nk�0�' ��@*���&�'�)� �y���$U���% �]E ��)�';�$�&X9���*ytD*�)����� �RX�qP;�SZynkq�BD ������&X���� ��� A

X�AO��AOÆJGF������XY��A�sC��&Nf���XY��AR�a��6>���*9�� '�LK��YX�Z¡AO¨��� � �����XuX�AOÜa �%��� �X�UhA�tPAOsC�&"8� ;��YXqaA-X�A#BD� ����&����XRUõ��� d6 �&?���"F% �&��� ����7E}+� �+O� ���g��� �+���'���'�)� ��� �<% '��+;���&�a;9�� �*@EGM�� ���XOoM� �+���'�& ��r ���+;�)���I§9� ���Ö��·~-d��1a-���� � � 1e� ��ZO��� ¥ A

�hA�r���� ���6�X�Õ�A��J� '������GM�����X>§������e���)����+O� ���I��&��;�@*��e� �4% ���+;�)���e+ ��@�&������� ���Xq��cU3++O�T�� I�)� X���� ��9���Y��"!oM��$+�@�2������� �9���YBD;0?@�����&��A

�¤A9Z¡A����56@�)���X�cA:�¤A¨����$�5���TX:UhAZ¡A��J����)����X �¤A�J�� ������*YX>��A�tPA|@;:�/��f��� &X�J�)���� ��&���a+9�� ������&���J��������a�)�4+9�� d�'���&���mEk���>Ek���&�������)�������'�)� ��M��"l+������$�S����& ������ �N�>E�)����&��X�BD;0?@�����&����"lBD������/���a�L�W-���� � � 1��L� � ¥ �0�@A

|�AR|@�T���_XO|�AOU3���� ��YXO¨3���*NO�@� f4��"!Bl�� ������)����oM� �+�������%��OZy�@*������&X�U���% �� ��)��;��I���*U�++���)�T������� ����X9oM;��+$���wv{¨3������È�oeÕPo3X���� ����X9oM;YA ± ± X++YA ± ± A)�xZ ± ± AÔ� ± A

¥ �

Page 39: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

William Dorland is an Associate Professor at the Department of Physics with joint appointments at the Center for Scientific Computing and Mathematical Modeling and the Institute for Research in Electronics and Applied Physics at the University of Maryland, College Park. He holds a Ph.D. in astro-physics from Princeton University (1993). His research interests include plasma turbulence, astrophysical gyrokinetics, and high-performance computing. George Stantchev is a Research Associate at the Center for Scientific Computing and Mathematical Modeling and the Center for Multiscale Plasma Dynamcis at the University of Maryland, College Park. He received his Ph.D. in Applied Mathematics and Scientific Computation from the University of Maryland in 2003. His current research focuses on high-performance computing, scientific visualization, and plasma turbulence simulations. Nail Gumerov is an Associate Research Scientist at the University of Maryland Institute for Advanced Computer Studies. He holds a Sc.D. degree in Physics and Mathematics from the Tyumen State University, Tymen, Russia (1992). His research interests comprise a number of disciplines ranging from acoustics and hydrodynamics to computer vision and high-performance computing, among others.

Page 40: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

Page 41: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT

Page 42: Accepted Manuscript - umiacs.umd.eduramani/pubs/stantchev_Dorland_Gumerov_JPD…Accepted Manuscript Fast parallel particle-to-grid interpolation for plasma PIC Simulations on the GPU

ACC

EPTE

DM

ANU

SCR

IPT

ACCEPTED MANUSCRIPT