<!DOCTYPE html><html><head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
  </head>
  <body>
    <h2 class="text-heading-large"> About the job </h2>
    <div class="mt4">
      <p dir="ltr"> NVIDIA is leading the way in groundbreaking
        developments in Artificial Intelligence, High Performance
        Computing and Visualization. The GPU, our invention, serves as
        the visual cortex of modern computers and is at the heart of our
        products and services. Our work opens up new universes to
        explore, enables amazing creativity and discovery, and powers
        what were once science fiction inventions from artificial
        intelligence to autonomous cars.<span><br>
        </span><span><br>
        </span>Come work for the team that brought to you NCCL, NVSHMEM
        & GPUDirect. Our GPU communication libraries are crucial for
        scaling Deep Learning and HPC applications! We are looking for a
        Distinguished Software Architect to help co-design our next
        generation data center platforms. DL and HPC applications have a
        huge compute demand already and run on scales which go up to
        tens of thousands of GPUs. The GPUs are connected with
        high-speed interconnects (eg. NVLink, PCIe) within a node and
        with high-speed networking (eg. Infiniband, Ethernet) across the
        nodes. Communication performance between the GPUs has a direct
        impact on the end-to-end application performance; and the stakes
        are even higher at huge scales! This is an outstanding
        opportunity to push the limits on the state-of-the-art and
        deliver platforms the world has never seen before. Are you ready
        to contribute to the development of innovative technologies and
        help realize NVIDIA's vision?<span><br>
        </span><span><br>
        </span><span><strong>What You Will Be Doing<span><br>
            </span><span><br>
            </span></strong></span><span> </span></p>
      <ul>
        <li>Research new communication technologies (e.g. expand the
          GPUDirect technology portfolio) and design new features for
          our communication libraries</li>
        <li>Propose innovative solutions in HW and SW for our next-gen
          platforms. You will co-design these solutions with the GPU,
          Networking, and SW architects and ensure seamless integration
          with the software stacks</li>
        <li>Inspire changes based on quantitative data coming from
          proof-of-concepts or detailed technical analysis/modeling</li>
        <li>Drive the adoption of new communication technologies across
          application verticals</li>
        <li>Keep up with the latest DL research and collaborate with
          diverse teams (internal and external), including DL
          researchers, and customers<span><br>
          </span><span><br>
          </span></li>
      </ul>
      <span><strong>What We Need To See<span><br>
          </span><span><br>
          </span></strong></span><span>
        <ul>
          <li>PhD in Computer Science, Computer Engineering or related
            field or strong equivalent experience; 15+ years of relevant
            experience in academia or the industry</li>
          <li>Expert in following areas: HPC, parallel programming
            models (MPI, SHMEM), at least one communication runtime
            (MPI, NCCL, NVSHMEM, OpenSHMEM, UCX, UCC), computer and
            system architecture, GPU architecture and CUDA</li>
          <li>Deep understanding of various aspects of high performance
            networking from prior work experience: network technologies
            (Infiniband, Ethernet), network design, network topologies,
            network debug and performance analysis</li>
          <li>Strong in at least a few of these areas: ML/DL
            fundamentals and how they tie to communications, parallel
            algorithms, fault tolerance and resiliency, competitive
            assessments, performance analysis and optimizations for
            parallel applications on large clusters, developing
            applications using DL Frameworks (PyTorch, TensorFlow)</li>
          <li>Programming fluency with C or C++ for systems software
            development</li>
          <li>Flexibility to work and communicate effectively across
            different HW/SW teams and timezones<span><br>
            </span><span><br>
            </span></li>
        </ul>
      </span><span><strong>Ways To Stand Out From The Crowd<span><br>
          </span><span><br>
          </span></strong></span><span>
        <ul>
          <li>Industry recognized leader in HPC/DL communications with
            history of patents, publications and conference talks and
            keynotes in areas relevant to this role</li>
          <li>Influential role in industry standards (e.g. MPI,
            OpenSHMEM) and open source software (e.g. PyTorch, UCX, Open
            MPI)<span><br>
            </span><span><br>
            </span></li>
        </ul>
      </span>NVIDIA is widely considered to be one of the technology
      world’s most desirable employers. We have some of the most
      forward-thinking and hardworking people on the planet working for
      us. If you're creative and autonomous, we want to hear from you!<span><br>
      </span><span><br>
      </span>
      <p><br>
      </p>
    </div>
    <p><br>
    </p>
  </body>
</html>