דרושים » דאטה » Senior ML Data Engineer

משרות על המפה
 
בדיקת קורות חיים
VIP
הפוך ללקוח VIP
רגע, משהו חסר!
נשאר לך להשלים רק עוד פרט אחד:
 
שירות זה פתוח ללקוחות VIP בלבד
AllJObs VIP
כל החברות >
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
לפני 6 שעות
חברה חסויה
Location: Jerusalem
Job Type: Full Time
The AI Engineering group builds modern infrastructure and solutions that improve how algorithms are developed at our company.
We are a small, independent team of experienced engineers with a mix of skills in algorithms, software, and infrastructure. We work in a DevOps style and build cross-team solutions that support research and development of advanced perception algorithms.
Our flagship project is a unified AV dataset used to train and evaluate next-generation models. We take large volumes of multi-camera video, object labels, HD maps, and sensor data from across the organization, and turn it into a curated, high-quality training set - at scale.
We are looking for someone who brings ML and computer-vision depth to the team - someone who can help shape the intelligence layer that decides what data is worth training on.
What will your job look like:
Work collaboratively with shared ownership. Your focus area will be the curation and ML side of our data pipeline, but you will contribute across the full stack alongside the rest of the team.
Build and improve the curation pipeline - from vision-model embeddings and scene detection, through VLM-based scene analysis, to scoring, deduplication, and sampling that produces a balanced and diverse dataset.
Run and optimize GPU inference at scale (embedding extraction, VLM inference) across thousands of driving sessions using workflow orchestration.
Develop scoring and sampling strategies that ensure rare but important scenarios (night driving, adverse weather, hazardous situations) are well-represented in the final dataset.
Work with algorithm teams to understand what data gaps hurt model performance and translate those into curation criteria.
Build validation and diagnostics that measure dataset quality - not just pipeline health, but whether the data is actually good for training.
Contribute to the core dataset SDK, converter, and 3D-geometry tooling (camera projection, calibration, coordinate transforms).
Requirements:
4+ years in data engineering or backend/software engineering with serious data work - pipelines that run in production, not just notebooks.
Strong Python and the PyData stack (NumPy, PyArrow, Pandas, DuckDB).
Some background in research, algorithms, or ML - enough that you can read a paper, understand a model's outputs, and have informed conversations with algorithm engineers.
Comfort working with vision-model outputs as data: embeddings, detection results, VLM responses.
Ability to work across team boundaries - this role lives between algorithm teams, infra teams, and our own.
Experience with autonomous-driving datasets or perception pipelines.
3D geometry and camera model intuition (or the mathematical background to ramp up).
Workflow orchestration (Argo, Airflow, Kubeflow).
Vector databases or columnar analytics (LanceDB, DuckDB, Parquet at scale).
Familiarity with curation concepts (active learning, hard-example mining, distribution balancing) - useful context, not a requirement.
Exposure to LLM agents or agentic workflows for data tasks.
This position is open to all candidates.
 
Hide
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8699036
סגור
שירות זה פתוח ללקוחות VIP בלבד
משרות דומות שיכולות לעניין אותך
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
 
משרה בלעדית
לפני 11 שעות
דרושים בSQLink
סוג משרה: משרה מלאה
ארגון ממשלתי באזור ירושלים מגייס data Scientist
התפקיד כולל: עבודה עם פיתוח ויישום פתרונות בינה מלאכותית מקצה לקצה, אימון ו-Fine-Tuning של מודלי שפה גדולים ומודלי תמונה, פיתוח אלגוריתמים ומודלים סטטיסטיים על גבי תשתיות Big Data, בניית מדדי ביצועים להערכת מודלים, הובלת תהליכי MLOps והעברת מודלים לסביבות ייצור, עבודה בסביבת GCP ושיתוף פעולה עם מנהלי מוצר, מהנדסי נתונים וצוותי דאטה לצורך הטמעת פתרונות AI מתקדמים ועוד.
דרישות:
- 3 שנות ניסיון בתפקידי דאטה
- שנה ניסיון כ- data Scientist
- שליטה מלאה ב- Python, כולל ארכיטקטורת תוכנה, Best Practices וכתיבת קוד
איכותי
- ניסיון באימון מודלים, Fine-Tuning ועבודה עם מודלי שפה גדולים (LLMs) או מודלי
תמונה
- ניסיון בפיתוח פתרונות RAG, חיפוש וקטורי, עיבוד תמונה (Computer Vision) ויישום
מודלים סטטיסטיים בסביבות Big Data המשרה מיועדת לנשים ולגברים כאחד.
 
עוד...
הגשת מועמדות
עדכון קורות החיים לפני שליחה
8682641
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
לפני 10 שעות
דרושים בקבוצת יעל
מיקום המשרה: ירושלים
סוג משרה: משרה מלאה ועבודה היברידית
פיתוח, תחזוקה ושיפור תהליכי ETL /ELT מתקדמים
תכנון והקמה של data Pipelines מורכבים בסביבות On-Prem ו-Cloud
אינטגרציה בין מערכות מרובות מקורות ויעדים
עבודה עם מחסני נתונים ( DWH ) ואגמי נתונים ( data Lake)
מידול, טיוב והעשרת נתונים ותכנון תהליכים אינקרמנטליים
כתיבת שאילתות SQL מורכבות ואופטימיזציה של ביצועים
השתלבות בפרויקטי מיגרציה לענן ועבודה בסביבת GCP ו-BigQuery
עבודה שוטפת מול צוותי data, BI, DBA ו- data Science
דרישות:
לפחות 4 שנות ניסיון בפיתוח ETL /ELT
ניסיון בתכנון ופיתוח data Pipelines מורכבים
ניסיון של שנתיים לפחות עם Talend
ניסיון בפיתוח תהליכי דאטה בסביבת GCP
שליטה גבוהה ב-SQL וכתיבת שאילתות מורכבות
ניסיון בעבודה עם בסיסי נתונים רלציוניים ו-NoSQL
ניסיון עם Dataform - יתרון
ניסיון בעבודה עם BigQuery - יתרון
ניסיון בפרויקטי Cloud Migration - יתרון המשרה מיועדת לנשים ולגברים כאחד.
 
עוד...
הגשת מועמדות
עדכון קורות החיים לפני שליחה
8698519
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
לפני 10 שעות
דרושים בMertens – Malam Team
מיקום המשרה: ירושלים
סוג משרה: מספר סוגים
חברת Mertens Malam Team מגייסת DBA תשתיתי.ת SQL server לארגון ציבורי בירושלים

התפקיד כולל:
ניהול מקצה לקצה של סביבת בסיסי הנתונים, כולל הקמה, תחזוקה, תפעול ותמיכה שוטפת במערכות SQL server בסביבת Production

עבודה עם SQL server, SQL server Internals, Execution Plans, Performance Tuning, Always On, High Availability, Disaster Recovery
דרישות:
ניסיון של 4 שנים כ- DBA תשתיתי.ת בסביבת MS SQL server - חובה
ניסיון מעשי ב- SQL server Internals כולל Execution Plans, Locking/Blocking, Memory Management, I/O - חובה
ניסיון מוכח ב-Performance Tuning ואופטימיזציה של שאילתות וניתוח ביצועים - חובה
ניסיון ביישום פתרונות High Availability ו-Disaster Recovery כולל Always On, אסטרטגיות גיבוי, Point-in-Time Recovery - חובה

ניסיון בהקמה, תחזוקה ותפעול בסיסי נתונים בסביבת Production ועבודה מול צוותי פיתוח - חובה המשרה מיועדת לנשים ולגברים כאחד.
 
עוד...
הגשת מועמדות
עדכון קורות החיים לפני שליחה
8591522
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
לפני 12 שעות
דרושים בוואן פתרונות טכנולוגיים בע"מ
מיקום המשרה: ירושלים
סוג משרה: משרה מלאה ועבודה היברידית
דרוש/ה data Engineer | ירושלים

ליחידת AI data דרוש/ה data Engineer מנוסה להשתלבות בפרויקט אסטרטגי להקמת data Lake ארגוני רחב היקף בסביבת Cloudera.

מיקום: ירושלים | משרה מלאה
היברידיות: יום עבודה מהבית בשבוע
דרישות:
תנאי סף:
תואר שני ומעלה בהנדסה / מדעי המחשב / סטטיסטיקה / חקר ביצועים / מתמטיקה
או
תואר שלישי מכל תחום, בצירוף 7 שנות ניסיון ומעלה
5 שנות ניסיון ומעלה בתחום

דרישות מקצועיות:
ניסיון כ- data Engineer / Big Data Developer
ניסיון עם Spark, Hive, Impala
פיתוח ב- Python / Scala / JAVA
SQL ברמה גבוהה
היכרות עם ארכיטקטורות נתונים מבוזרות

יתרון: Airflow, Kafka, ML/AI, GCP המשרה מיועדת לנשים ולגברים כאחד.
 
עוד...
הגשת מועמדות
עדכון קורות החיים לפני שליחה
8682301
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
דרושים בוואן פתרונות טכנולוגיים בע"מ
מיקום המשרה: ירושלים ותל אביב יפו
סוג משרה: משרה מלאה ועבודות ללא קורות חיים
אפיון, תכנון ופיתוח שכבות נתונים בסביבת Lakehouse (Bronze / Silver / Gold).
ניתוח נתונים ותהליכים עסקיים והטמעתם במודלים אנליטיים.
הגדרת תהליכי טרנספורמציה, אינטגרציה וטיוב נתונים בין מערכות.
ביצוע data Modeling לוגי ופיזי בהתאם לצרכים עסקיים ואנליטיים.
ניטור ושיפור איכות הנתונים ( data Quality) והגדרת בקרות.
ליווי תהליכי פיתוח והטמעת פתרונות מול צוותי data Engineering.
כתיבת מסמכי אפיון טכניים ופונקציונליים ותחזוקת data Catalog.
דרישות:
לפחות 5 שנות ניסיון בניתוח מערכות data / DWH / BI.
ניסיון בעבודה עם ארכיטקטורת Lakehouse והיכרות עם שכבות Bronze, Silver ו-Gold.
ניסיון מוכח ב- data Modeling, כולל עבודה עם Star Schema.
שליטה גבוהה ב-SQL.
ניסיון בעבודה עם כלי ETL /ELT וכלי data מודרניים.
הבנה מעמיקה בתחומי data Governance ו- data Quality.
ניסיון בעבודה מול צוותי data Engineering וגורמים טכנולוגיים.
יכולת אנליטית גבוהה וראייה מערכתית רחבה.

יתרונות
ניסיון בעבודה עם פלטפורמות ענן AWS / Azure / GCP.
היכרות עם כלי BI כגון Power BI, Tableau או Qlik Sense.
ניסיון בעבודה עם כלי data Catalog או data Lineage.
רקע פיננסי או ניסיון בארגונים פיננסיים. המשרה מיועדת לנשים ולגברים כאחד.
 
עוד...
הגשת מועמדות
עדכון קורות החיים לפני שליחה
8693711
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
לפני 6 שעות
Location: Jerusalem
Job Type: Full Time
The AI Engineering group builds modern infrastructure and solutions that improve how algorithms are developed at our company.
We are a small, independent team of experienced engineers with a mix of skills in algorithms, software, and infrastructure. We work in a DevOps style and build cross-team solutions that support research and development of advanced perception algorithms.
Our flagship project is a unified AV dataset used to train and evaluate next-generation models. We take large volumes of multi-camera video, object labels, HD maps, and sensor data from across the organization, and turn it into a curated, high-quality training set - at scale.
We are looking for someone who brings ML and computer-vision depth to the team - someone who can help shape the intelligence layer that decides what data is worth training on.
What will your job look like:
Work collaboratively with shared ownership. Your focus area will be the curation and ML side of our data pipeline, but you will contribute across the full stack alongside the rest of the team.
Build and improve the curation pipeline - from vision-model embeddings and scene detection, through VLM-based scene analysis, to scoring, deduplication, and sampling that produces a balanced and diverse dataset.
Run and optimize GPU inference at scale (embedding extraction, VLM inference) across thousands of driving sessions using workflow orchestration.
Develop scoring and sampling strategies that ensure rare but important scenarios (night driving, adverse weather, hazardous situations) are well-represented in the final dataset.
Work with algorithm teams to understand what data gaps hurt model performance and translate those into curation criteria.
Build validation and diagnostics that measure dataset quality - not just pipeline health, but whether the data is actually good for training.
Contribute to the core dataset SDK, converter, and 3D-geometry tooling (camera projection, calibration, coordinate transforms).
Requirements:
4+ years in data engineering or backend/software engineering with serious data work - pipelines that run in production, not just notebooks.
Strong Python and the PyData stack (NumPy, PyArrow, Pandas, DuckDB).
Some background in research, algorithms, or ML - enough that you can read a paper, understand a model's outputs, and have informed conversations with algorithm engineers.
Comfort working with vision-model outputs as data: embeddings, detection results, VLM responses.
Ability to work across team boundaries - this role lives between algorithm teams, infra teams, and our own.
Experience with autonomous-driving datasets or perception pipelines.
3D geometry and camera model intuition (or the mathematical background to ramp up).
Workflow orchestration (Argo, Airflow, Kubeflow).
Vector databases or columnar analytics (LanceDB, DuckDB, Parquet at scale).
Familiarity with curation concepts (active learning, hard-example mining, distribution balancing) - useful context, not a requirement.
Exposure to LLM agents or agentic workflows for data tasks.
This position is open to all candidates.
 
Show more...
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8699051
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
לפני 5 שעות
חברה חסויה
Location: Jerusalem
Job Type: Full Time
we are seeking a strong ML Software Engineer to join our deep learning LiDAR & Radar group and help scale the systems that bring cutting‑edge perception models into production. Youll build the software layers, data pipelines, and runtime systems that turn advanced neural networks into reliable, high-performance solutions running on edge devices.
This is a hands-on, high‑ownership role within a growing group working closely with algorithm developers. The work spans Python and C++, ML infrastructure, model integration, performance optimization, and production delivery.
What will your job look like:
Lead end-to-end development of features - from design and implementation to integration, testing, and deployment
Build ML pipelines for data-based diverse dataset creation and efficient model inference
Design data selection and sampling strategies to ensure coverage of rare and critical scenarios
Partner with algorithm teams to translate model weaknesses into data curation criteria
Develop validation and diagnostics to measure dataset quality-not just pipeline health but training effectiveness
Integrate neural network models into C++ production systems, including runtime, data flow, and pre/post‑processing
Bring models from research/prototype stage into robust, production‑ready deployments
Optimize runtime performance (latency, memory, and throughput) in resource‑constrained environments
Contribute to deployment flows (e.g., model conversion, profiling, optimization)
Build and improve CI/CD pipelines, automated testing, and development workflows.
Requirements:
B.Sc. in Computer Science, Software Engineering, or equivalent
3+ years of hands-on C++ development experience
3+ years of hands-on Python development experience, including the PyData stack (NumPy, Pandas)
Experience working in Linux environments
Strong motivation to work closely with deep learning algorithms and production of AI systems
Interest in neural network deployment on edge devices, including inference runtimes, performance optimization, and model integration
Proven ability to work across team boundaries (algorithms, infra, product)
Strong motivation to work on production AI systems and deep learning integration
Interest in edge deployment, inference runtimes, and performance optimization
Advantages:
Experience with autonomous-driving datasets or perception pipelines
Background in 3D geometry and/or strong mathematical foundation
Experience with workflow orchestration tools (Airflow, Argo)
Familiarity with data curation techniques (e.g., active learning, hard example mining, distribution balancing)
2+ years in data engineering or backend systems with large‑scale data (production environments).
This position is open to all candidates.
 
Show more...
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8699122
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
27/05/2026
חברה חסויה
Location: Jerusalem
Job Type: Full Time and Hybrid work
We're looking for a Data Engineer with 4+ year experience to join our Data Engineering team and help us build and scale our production-grade data platform. You'll work on high-performance systems built on self-hosted ClickHouse, optimize complex data pipelines, and collaborate closely with Product, Analytics, and Infrastructure teams to deliver reliable, fast, and scalable data solutions.
This is a hands-on technical role where you'll have a significant impact on how we ingest, model, store, and serve data that powers our analytics and AI-driven products.
Youll play a key role in shaping the direction of our data platform and have meaningful ownership over critical components of our architecture.
What You'll Do:
Data Modeling & Architecture
Design and evolve data models that reflect business logic and support analytical use cases
Collaborate with the BI and Analytics teams to understand data requirements and translate them into efficient schemas
Performance Optimization
Optimize ClickHouse schemas, partitioning strategies, indexing, and compression
Profile and tune slow queries to improve performance and reduce costs
Implement systems that ensure data quality, consistency, and operational efficiency (e.g., deduplication, validation, anomaly detection)
Monitor pipeline health, data freshness, and query performance with appropriate alerting mechanisms
SQL Compiler Development
Develop and maintain the SQL Compiler layer that translates high-level queries into optimized ClickHouse execution plansImplement query optimization and rewriting strategies to improve performanceDebug and resolve compiler issues to ensure accurate and efficient query translation
Data Pipeline Development & Collaboration
Review and advise the Integration team on pipeline architecture, performance, and best practices.
Provide guidance on data modeling, schema design, and optimization for new data sources.
Troubleshoot and maintain existing pipelines when issues arise or optimization is needed
Ensure data freshness, reliability, and quality across all ingestion pipelines.
Collaboration & Support
Work closely with the Integration team to ensure smooth data ingestion from new sources.
Partner with Infrastructure to support high availability and disaster recovery
Support other teams across the company in accessing and using data effectively.
דרישות:
Required
Excellent communication and collaboration skills
English at a high level, written and spoken required
Ability to work from our Jerusalem office (located in the Central Bus Station next to the train) 2 times a week (Monday & Wednesday) is required
Strong attention to detail, ownership mentality, and ability to work independently
Quick learner who can dive into new codebases, technologies, and systems independently
Hands-on mentality - not afraid to roll up your sleeves, dig into unfamiliar code, and work across the stack (including backend when needed)
4+ years of experience as a Data Engineer
Strong problem-solving skills for complex data challenges at scale - ability to debug performance issues, data inconsistencies, and system bottlenecks in high-volume environments
Experience with data modeling and schema design for analytical workloads
Strong proficiency in SQL and experience with complex analytical queries
Hands-on experience building and maintaining data pipelines (ETL/ELT)
Ability to troubleshoot and optimize systems handling large data volumes (millions+ rows, complex queries, high throughput)
Knowledge of query optimization techniques and execution planning
Familiarity with columnar databases (ClickHouse, BigQuery, Redshift, Snowflake, or similar). Columnar DB experience is a big plus.
Nice to Have
Experience with ClickHouse specifically
Experience with real-time or streaming data pipelines
Familiarity with SQL compilers or query engines
Background in data quality frameworks and observability tools
Experience with infrastructure as code (Terraform, Ansible, המשרה מיועדת לנשים ולגברים כאחד.
 
Show more...
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8669052
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
1 ימים
Location: Jerusalem
Job Type: Full Time
Required Research Scientist - LTX Model Evaluation
The Role
As a Research Scientist in Model Evaluation, you are the ultimate authority on model quality and utility. You will design the automated judges, reward models, evaluation datasets, and benchmarking ecosystems that determine the future of LTX. Your mission is to provide the "ground truth" for our pre-training and post-training teams. You will blend the rigor of a researcher with the intuition of a product-thinker, developing metrics that capture both the aesthetic soul of a video and the functional precision required for high-stakes professional use.
Key Responsibilities:
Steer Training & Research: Systematically evaluate model checkpoints to provide actionable insights that guide training experiments and architectural decisions.
Design Benchmark Ecosystems: Develop and run rigorous benchmarks for release candidates against competitive models, ensuring LTX-2 remains world-class.
Build Next-Gen Metrics: Develop robust automatic metrics and Reward Models (e.g., for RL, ITS, auto-research agents) that quantify complex attributes like temporal coherence, physical correctness, spatial accuracy, and foley synchronization.
Diagnose & Analyze: Perform deep root-cause analysis on model failures, providing the diagnostic clarity needed for researchers to implement targeted fixes.
Scale Evaluation: Collaborate with platform engineers to deploy evaluation frameworks across large-scale GPU clusters.
Requirements:
Ideal Candidate
Technical Depth: Masters or PhD in Computer Vision, ML, or a related field, with strong software engineering skills and comfort in complex ML training environments.
The "Metric" Mindset: Deep expertise in evaluation methodology and statistical rigor. You know why standard metrics often fail and how to build better ones.
Perceptual Intuition: A sharp "eye and ear" for quality. You can articulate subtle nuances in motion or sound that automated systems might miss and use that intuition to improve our reward models.
Data-Driven Detective: You love diving into datasets to find the "why" behind the numbers, taking pride in curating and specializing data for specific evaluation tasks.
Product-Minded Scientist: You can think like an end-user. You care that our models don't just "beat the benchmark" but actually work reliably in professional pipelines.
Statistical Rigor: You understand experimental design, significance testing, and the nuances of perceptual quality assessment.
This position is open to all candidates.
 
Show more...
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8697042
סגור
שירות זה פתוח ללקוחות VIP בלבד
סגור
דיווח על תוכן לא הולם או מפלה
מה השם שלך?
תיאור
שליחה
סגור
v נשלח
תודה על שיתוף הפעולה
מודים לך שלקחת חלק בשיפור התוכן שלנו :)
1 ימים
Location: Jerusalem
Job Type: Full Time
Required Research Scientist - Audiovisual Understanding, Model Foundations
Team & role
The Core Generative AI team is a unified group of researchers and engineers dedicated to developing our generative foundational models that serve LTX Studio, our AI-based video creation platform. Our focus is on creating a controllable, cutting-edge video generative model by merging cutting-edge algorithms with exceptional engineering. This involves enhancing machine learning components within our sophisticated internal training framework, crucial for developing advanced models. We specialize in both research and engineering that enable efficient and scalable training and inference, allowing us to deliver state-of-the-art AI-generated video models.
As a Large Scale Video Understanding Research Scientist, you will play a key role in improving video generation quality and efficiency by improving video and audio understanding pipelines used for both training data construction and model evaluation.. This role demands hands-on work with large-scale Video Language Models (VLLMs), including fine-tuning, post-training, and control, alongside implementing classic computer vision and signal processing algorithms and applying strong research skills. Your expertise in post-training and controlling large scale foundational models, understanding statistics, implementing complex systems and eliminating bugs will be crucial, as our video training sets consist of petabytes of data processed across hundreds to thousands of virtual machines.
What you will be doing:
Fine-tune and control VLLMs for video and audio understanding.
Design algorithms for balancing, filtering, and curating training and evaluation datasets, informed by model behavior and failure modes.
Implement classic and modern algorithms for processing, clustering, evaluation and filtering of large scale datasets.
Work within high-performance, scalable distributed systems capable of handling petabytes of data, with attention to throughput, correctness, and reproducibility..
Collaborate with other researchers and product stakeholders to iteratively improve training sets and evaluation protocols through tight feedback loops driven by model performance.
Requirements:
Experience training, fine-tuning, or post-training large-scale VLLMs or multimodal foundation models.
Strong software engineering skills, proficient in Jax or PyTorch.
Ability to develop and implement computer vision models for data filtering and evaluation.
Understanding of relevant topics in statistics, clustering.
Enjoys delving into system implementations to enhance performance and maintainability.
This role is designed for individuals who are not only technically proficient but also deeply passionate about pushing the boundaries of AI and machine learning through innovative engineering and collaborative research.
This position is open to all candidates.
 
Show more...
הגשת מועמדותהגש מועמדות
עדכון קורות החיים לפני שליחה
עדכון קורות החיים לפני שליחה
8697054
סגור
שירות זה פתוח ללקוחות VIP בלבד