דרושים » תוכנה » AI Framework Software Engineer, Performance Optimizations

משרות על המפה
 
בדיקת קורות חיים
VIP
הפוך ללקוח VIP
רגע, משהו חסר!
נשאר לך להשלים רק עוד פרט אחד:
 
שירות זה פתוח ללקוחות VIP בלבד
AllJObs VIP
כל החברות >
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
לפני 15 שעות
Location: Haifa and Hod Hasharon
Job Type: Full Time
Our team at the Huawei Computing Network Innovation Lab is looking for exceptional talent to join us and lead the development of next generation data centers. We create cutting-edge technologies that synergize software and hardware in tandem to accelerate compute, storage and networking at large-scale. We aim to drive innovations and deliver software defined infrastructure and algorithms to HPC, AI/ML, and Big Data applications.
We are looking for outstanding candidates with hands-on experience in development and optimization of AI frameworks. If you are a team player with excellent communication skills and motivation to revolutionize application performance, youre welcome on board!
What will you be doing?
Work as part of an innovative research team to analyze, develop, test and deploy improvements that enhance Huaweis distributed AI framework.
Develop optimizations that leverage hardware accelerator capabilities, minimize communication overhead and improve training/inference throughput
Push the boundaries of the state of the art in LLM performance and efficiency, including model compression and quantization
Analyze, profile and optimize the latest LLM AI algorithms, and implement as production-quality software libraries for latency-critical use-cases on next-generation hardware.
Work in a distributed computing environment to optimize for both scale-up (multi-device) and scale-out (multi-node) systems
Utilize advanced concepts such as Uncertainty Quantification, Mixed Precision Computing and Model Sparsity to improve performance and enable training of very large AI models
Collaborate with partners from top universities, and open-source communities to conduct state-of-the-art research.
Requirements:
B.Sc. degree in computer science, computer engineering, or a closely related field
5+ years of experience in AI kernel and performance optimizations
Excellent C/C++ programming and software design skills, including debugging, performance analysis, and testing
Strong technical skills and experience with developing code in a Linux environment
Excellent teamwork and interpersonal skills
Ability to work independently, define project goals and scope, and lead your own development effort
Innovative thinking
Ways to stand out from the crowd:
M.Sc. or Ph.D. degree
Proven track record of conducting and publishing independent research
Experience in optimizing distributed deep learning pipelines with TensorFlow / PyTorch
Experience in analyzing workloads on large scale heterogeneous clusters
Hands-on experience in developing code to target heterogeneous architectures (e.g. CPU/GPU/TPU)
Experience in developing and contributing to large open-source libraries.
This position is open to all candidates.
 
Hide
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8483400
סגור
שירות זה פתוח ללקוחות VIP בלבד
משרות דומות שיכולות לעניין אותך
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
 
משרה בלעדית
לפני 21 שעות
חברה חסויה
Job Type: Full Time and Hybrid work
As a member of the Control Team, this role contributes to the development of next-generation control algorithms and engineering tools, while also supporting customers with deep technical expertise across the company solutions.
Reports to: CTO
Requirements:
M.Sc.in Mechatronics/Autonomous Systems/Robotics/Mechanical Engineering/Aeronautical Engineering, or a closely related discipline.
Proven experience in data -driven algorithm development, with an advantage for experience on real-world time-series data.
Strong foundation in Control Theory
Solid knowledge in at least two of the following areas:
o Neural Networks Architectures (RNN/CNN/PINN),
o Hyperparameters Optimization,
o Feature Engineering,
o Optimization Methods,
o Reinforcement Learning
o Real-Time Learning/Estimation
Proficiency in at least two programming environments: C / C ++, Python, MATLAB / Simulink.
Ability to design algorithms from the ground up, as well as effectively utilize modern open-source ML and control libraries.
Strong analytical and problem-solving skills.
Fluent in English, both written and spoken.
This position is open to all candidates.
 
Show more...
הגשת מועמדות
עדכון קורות החיים לפני שליחה
8482186
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
דרושים בגב מערכות
מיקום המשרה: חיפה
סוג משרה: משרה מלאה ועבודה היברידית
מהנדס/ת תוכנה מנוסה בתחום AI ו-LLM
מיקום: חיפה

אנחנו מחפשים מהנדס/ת תוכנה מנוסה להצטרפות לצוות התשתיות שלנו ולהובלת פיתוח מערכות מתקדמות המבוססות על מודלי שפה (LLM). התפקיד כולל אחריות מקצה לקצה על בנייה, אופטימיזציה והטמעה של מערכות חכמות ויציבות בסביבת פרודקשן.

תחומי אחריות:

פיתוח ותחזוקה של שירותים ותהליכי נתונים סביב מודלי שפה.

בנייה ואופטימיזציה של מערכות RAG.

אינטגרציה ו-Orchestration עם LangChain ו-LiteLLM.

עבודה עם מאגרי נתונים וקטוריים (Vector DBs).

פיתוח קוד איכותי, בדיקות, ניטור ו-CI/CD.

שיתוף פעולה עם צוותי מוצר, דאטה ו- DevOps.
דרישות:
3-6+ שנות ניסיון בפיתוח תוכנה.

ניסיון מעשי בעבודה עם AI ו-LLM.

שליטה ב- Python ו/או C ++.

ניסיון עם מערכות RAG ו-Vector DBs.

הבנה באבטחה, הרשאות וניהול סודות.

יכולת הובלה, תקשורת מצוינת ו-Delivery עצמאי.

יתרון:

ניסיון בעבודה עם MCP.

עבודה עם LangChain ו-LiteLLM.

היכרות עם Azure, תורים ומערכות ענן.

Prompt Engineering מתקדם. המשרה מיועדת לנשים ולגברים כאחד.
 
עוד...
הגשת מועמדות
עדכון קורות החיים לפני שליחה
8432166
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
1 ימים
Location: Haifa
Job Type: Full Time
As an ML Software Engineer with a focus on low-level and CUDA-based optimizations, you will play a key role in shaping the design, performance, and scalability of our companys machine learning inference systems. Youll work on deeply technical challenges at the intersection of GPU acceleration, systems architecture, and ML deployment.
Your expertise in CUDA, C/C++, and performance tuning will be crucial in enhancing runtime efficiency across heterogeneous computing environments. Youll collaborate with designers, researchers, and backend engineers to build production-grade ML pipelines that are optimized for latency, throughput, and memory use, contributing directly to the infrastructure powering our company's next-generation AI products.This role is ideal for an engineer with strong systems-level thinking, deep familiarity with GPU internals, and a passion for pushing the boundaries of performance and efficiency in machine learning infrastructure.
Responsibilities
Design and implement highly optimized GPU-accelerated ML inference systems using CUDA and low-level parallelism techniques
Optimize memory, compute, and data flow to meet real-time or high-throughput constraints
Improve the performance, reliability, and observability of our inference backend across diverse compute targets (CPU/GPU)
Collaborate with cross-functional teams (including researchers, developers, and designers) to deliver efficient and scalable inference solutions
Contribute to ComfyUI and internal infrastructure to improve the usability and performance of model execution flows
Investigate performance bottlenecks at all levels of the stack-from Python to kernel-level execution
Navigate and enhance a large, complex, production-grade codebase
Drive innovation in low-level system design to support future ML workloads.
Requirements:
5+ years of experience in high-performance software engineering
Advanced proficiency in CUDA, C/C++, and Python, especially in production environments
Deep understanding of GPU architecture, memory hierarchies, and optimization techniques
Proven track record of optimizing compute-intensive systems
Strong system architecture fundamentals, especially around performance, concurrency, and parallelism
Ability to independently lead deep technical investigations and deliver clean, maintainable solutions
Collaborative and team-oriented mindset, with experience working across functional teams
Preferred Requirements
Experience with low-level profiling and debugging tools (e.g., Nsight, perf, gdb, VTune)
Familiarity with machine learning frameworks (e.g., PyTorch, TensorRT, ONNX Runtime)
Contributions to performance-critical open-source or ML infrastructure projects
Experience with cloud infrastructure and GPU scheduling at scale.
This position is open to all candidates.
 
Show more...
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8481490
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
14/12/2025
Location: Haifa
Job Type: Full Time
We are looking for a Senior Network SW Engineer to join the SW group and take a major part in redefining the future of AWS cloud.
Were searching for engineers with a passion for networking to develop SRD (Scalable Reliable Datagram). SRD is a high-performance, low-latency transport protocol used within our Web Services (AWS) infrastructure to optimize network performance. SRD powers several high-impact, cutting-edge products, including on-demand ML and HPC platforms leveraging EFA, next-generation storage services built on EBS, and the future of AWS network traffic.
Key job responsibilities
As a Senior Network Software Engineer on SRD team, your primary role will be to develop and optimize the implementation of SRD technology across AWS's network infrastructure. Your responsibilities will encompass designing, deploying, and maintaining SRD code-base, ensuring its reliability and scalability to accommodate the demands of various applications. An essential part of your role will involve conducting extensive network simulations to evaluate system performance under different conditions, enabling you to identify potential bottlenecks and inefficiencies. Using these simulations, you will troubleshoot network issues and implement robust solutions, leading to minimal data loss and latency. Leveraging your in-depth understanding of network protocols and AWS infrastructure, you'll refine and improve the SRD system's performance. Furthermore, you will be expected to mentor junior team members, leading projects to advance the SRD capabilities within the AWS environment. Staying updated with the latest industry trends and incorporating them into strategic network service planning.
Requirements:
Basic Qualifications
- Bachelors (or higher) Degree in Computer Science (CS), Electrical Engineering (EE) or related area.
- 8+/10+ years of programming with at least one software programming language experience
Preferred Qualifications
- Experience as a mentor, tech lead or leading an engineering team
- Experience leading the architecture and design (architecture, design patterns, reliability and scaling) of new and current systems
- Data-center Networking
- Network related simulators
- Large-scale distributed environments
- Storage and/or Transport protocols
- Real-Time development.
This position is open to all candidates.
 
Show more...
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8455950
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
Location: Tel Aviv-Yafo and Haifa
Job Type: Full Time
We are looking for a JAVA Expert to join our new product initiative in data processing and analysis infrastructure.
We are the data platform company for the AI era. We are building the enterprise software infrastructure to capture, catalog, refine, enrich, and protect massive datasets and make them available for real-time data analysis and AI training and inference. Designed from the ground up to make AI simple to deploy and manage, We take the cost and complexity out of deploying enterprise and AI infrastructure across data center, edge, and cloud.Our success has been built through intense innovation, a customer-first mentality and a team of fearless who leverage their skills & experiences to make real market impact. This is an opportunity to be a key contributor at a pivotal time in our companys growth and at a pivotal point in computing history.
Location: Tel Aviv / Haifa - Israel.
Requirements:
We are looking for talented Java engineers to develop next-generation state-of-the-art high-performance data solutions for analytical and transactional processing.
Strong experience in Java software engineering of multithreaded high-performance applications - design, coding, integration, and debugging
BSc/MSc degree in Computer Science, Engineering or equivalent
Understanding of Linux operating system
Understanding of Presto / Spark or similar solutions - advantage
Knowledge block-level storage / file systems / databases advantage
Python scripting advantage.
This position is open to all candidates.
 
Show more...
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8441180
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
חברה חסויה
Location: Haifa
Job Type: Full Time
We are recruiting an MLOps / AI-Ops Engineer to join our data & AI Division in Haifa.
This role is responsible for managing, optimizing, and scaling the organizations AI/ML infrastructure across both cloud and on-prem environments, ensuring high availability, performance, and cost efficiency.
Role Overview:
* Manage day-to-day AI infrastructure operations, ensuring reliability, performance, and scalability.
* Deploy, configure, maintain, and troubleshoot AI platforms and tools, including GPU orchestration, Kubernetes, MLflow/Kubeflow, and vector databases.
* Monitor resource utilization (CPU, GPU, memory, Storage, network) and implement performance optimizations.
* Support CI/CD pipelines and infrastructure automation using Infrastructure as Code (Terraform, Ansible).
* Implement security best practices, manage access control, and ensure compliance with AI governance policies.
* Troubleshoot operational incidents and collaborate with AI Platform and AI Security Engineers.
* Contribute to documentation, runbooks, and knowledge sharing.
* Identify opportunities to improve AI infrastructure processes and tooling.
This position is open to all candidates.
 
Show more...
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8418230
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
חברה חסויה
Location: Haifa
Job Type: Full Time
We are looking for a Senior Software Engineer to join our growing team!
This is a great opportunity to be part of one of the fastest-growing infrastructure companies in history, an organization that is in the center of the hurricane being created by the revolution in artificial intelligence.
Requirements:
Strong experience in C/C++ software design, coding, integration, and debugging
Good team-work abilities, and the ability to be independent - get things done
BSc/MSc degree in Computer Science, Engineering or equivalent
Understanding of Linux operating system
Experience and knowledge in multi-threading development
Knowledge in Storage and/or file systems - advantage.
This position is open to all candidates.
 
Show more...
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8441153
סגור
שירות זה פתוח ללקוחות VIP בלבד