Build software better, together

GVProf / GVProf

GVProf: A Value Profiler for GPU-based Clusters

machine-learning patterns profiler gpu cuda data-flow instrumentation binary-analysis clusters redundancy gpu-optimization value-profiler

Updated Mar 24, 2024
Python

philtimmes / KeSSie

Star

KeSSie HUGE Context Semantic recall for Large Language Models

Updated Feb 21, 2026
Python

The GPU Optimizer for ML Models enhances GPU performance for machine learning. It offers advanced scheduling, real-time monitoring, and efficient resource management through a user-friendly web interface and robust API, integrating big data technologies for seamless data processing and model optimization. @NVIDIA

model-management gpu-optimization real-time-monitoring secure-api big-data-integration gpu-scheduling

Updated Dec 28, 2025
Python

OriginNeuralAI / OriginNeuralAI

Star

Physics-based computation at scale — Hamiltonian dynamics, spectral theory, and statistical mechanics powering optimization, drug discovery, genomics, molecular proof, and agentic commerce.

genomics drug-discovery ising-model post-quantum-cryptography hamiltonian-dynamics gpu-optimization simulated-bifurcation blockchain-verification spectral-theory physics-based-computation

Updated Feb 21, 2026
Python

JeyaPrakashI / Multi-Cloud-Governance-Ledger-FOCUS-1.3

Star

Executive FinOps dashboard and automated governance engine using FOCUS 1.3 standards for AWS, Azure, and Snowflake.

automation power-bi data-engineering multi-cloud gpu-optimization finops platform-engineering cloud-governance cloud-ops cloud-economics azure-finops aws-finops ai-infrastructure focus-1-3 llmops-finance serverless-governance gcp-finops

Updated Feb 14, 2026
Python

pratheeksha2023 / T2V-Studio-Text_Powered_Video_Generator

Star

Text-to-video generation application that converts natural language (english) prompts into short animated videos using diffusion models and AnimateDiff, with GPU-aware optimization and an interactive Gradio UI that can be executed on Google Colab (T4 GPU).

computer-vision gradio gpu-optimization google-colab diffusion-models text-to-video stable-diffusion generative-ai animatediff

Updated Jan 1, 2026
Python

flickleafy / ollama_consumer

Star

🤖 Ollama Consumer - A Python-based interactive chat interface for Ollama models with advanced model management, comprehensive benchmarking, vision support, and automatic error recovery. Features dynamic model switching, GPU optimization, and intelligent service monitoring for seamless AI model interactions.

python benchmarking machine-learning automation ai chatbot configuration-management language-models error-recovery model-management cli-tool multimodal gpu-optimization service-monitoring interactive-chat vision-models llm ollama-api moe-models

Updated Aug 6, 2025
Python

petroslamb / hardware-friction-scorecard-dataset

Star

Quantitative dataset of 119 neural architectures (2017-2025) scored on hardware compatibility and ecosystem friction. Validates the Transformer Attractor thesis.

machine-learning dataset transformer gpu-optimization production-ml neural-architecture hardware-compatibility

Updated Dec 16, 2025
Python

OriYarden / pytorch_training_optimization_using_tensordict_memory_mapping

Star

Optimizing PyTorch Model Training by Wrapping Memory Mapped Tensors on Nvidia GPUs with TensorDict.

Updated May 27, 2025
Python

ai-infra-curriculum / ai-infra-senior-engineer-learning

Star

AI Infrastructure Senior Engineer Learning Track - Advanced ML infrastructure and technical leadership

kubernetes learning distributed-systems machine-learning performance curriculum advanced gpu-optimization mlops senior-engineer ai-infrastructure

Updated Nov 3, 2025
Python

danindiana / copilot-bridge

Star

Hybrid AI routing: LOCAL Ollama + CLOUD GitHub Copilot

python machine-learning ai prometheus performance-optimization cost-optimization gpu-optimization meta-reasoning smart-routing dual-gpu github-copilot llm local-llm ollama ai-proxy llm-routing

Updated Oct 19, 2025
Python

Kuenoz / pytorch_training_optimization_using_tensordict_memory_mapping

Star

Optimizing PyTorch Model Training by Wrapping Memory Mapped Tensors on an Nvidia GPU with TensorDict.

python ai gpu optimization torch pytorch tensors memory-mapping gpu-optimization pytorch-tensors pytorch-training tensordict memory-mapped-tensors pytorch-training-optimization

Updated Mar 4, 2026
Python

kuttivicky / Waymo-e2e-profiler

Star

Profile-first ML systems project optimizing a multi-camera end-to-end driving model for hardware efficiency using PyTorch, CUDA streams, NVTX instrumentation, and Nsight Systems.

performance-engineering deep-learning async cuda pytorch gpu-optimization nvtx ml-systems nsight-systems automomous-driving

Updated Feb 12, 2026
Python

TravisLeeTS / llm-scheduler-sim

Star

LM Multi-Bin Dynamic Scheduler Simulator - Implementation combining Multi-Bin batching with SLA-constrained dynamic batching

scheduler gpu-optimization dynamic-batching llm

Updated Dec 3, 2025
Python

forgottenforge / levi-edge

Star

Drop-in small-matrix acceleration for PyTorch on edge devices

cuda inference pytorch matrix-multiplication jetson edge-computing gpu-optimization

Updated Feb 3, 2026
Python

JonSnow1807 / Fused-LayerNorm-CUDA-Operator

Star

High-performance CUDA implementation of LayerNorm for PyTorch achieving 1.46x speedup through kernel fusion. Optimized for large language models (4K-8K hidden dims) with vectorized memory access, warp-level primitives, and mixed precision support. Drop-in replacement for nn.LayerNorm with 25% memory reduction.

deep-learning cuda pytorch gpu-optimization kernel-fusion layernorm

Updated Aug 17, 2025
Python

tukue / aws-finops-container-optimization

Star

🚀 AWS FinOps Container Optimization for AI Workloads Reference implementation of FinOps best practices for optimizing ECS/EKS-based AI workloads on AWS. Achieve cost optimization through spot instances, autoscaling, and intelligent resource management. 🎯 Key Features: • Spot instance strategies for AI training/inference and cost visibility

aws infrastructure-as-code autoscaling gpu-optimization finops

Updated Feb 17, 2026
Python

intelav / GeoAccel-AI

Star

GPU-Optimized AI for Geospatial Annotation and Visual Search Accelerating Geospatial Intelligence through Distillation, Segmentation, and GPU Optimization.

geospatial remote-sensing gpu-acceleration segmentation satellite-imagery gpu-optimization auto-annotation yolov8

Updated Nov 26, 2025
Python

anurag2796 / hybrid-ml-scheduler

Star

An advanced hybrid scheduling framework that leverages Reinforcement Learning and ML to dynamically optimize CPU/GPU task allocation in real-time.

python machine-learning reinforcement-learning task-scheduler resource-allocation gpu-optimization

Updated Feb 24, 2026
Python

JeyaPrakashI / Cloud-Commitment-ROI-Simulator

Star

Enterprise-grade financial framework for modeling $5.4M+ cloud contract ROI and risk sensitivity. Features automated break-even analysis, 3-year commitment simulation for AI/GPU infrastructure, and a CFO-ready stress-test matrix to prove profitability even at 40% utilization. Designed for high-stakes C-Suite decision support.

Updated Feb 24, 2026
Python

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

gpu-optimization

Here are 28 public repositories matching this topic...

GVProf / GVProf

philtimmes / KeSSie

raj200501 / GPUOptimizerML

OriginNeuralAI / OriginNeuralAI

JeyaPrakashI / Multi-Cloud-Governance-Ledger-FOCUS-1.3

pratheeksha2023 / T2V-Studio-Text_Powered_Video_Generator

flickleafy / ollama_consumer

petroslamb / hardware-friction-scorecard-dataset

OriYarden / pytorch_training_optimization_using_tensordict_memory_mapping

ai-infra-curriculum / ai-infra-senior-engineer-learning

danindiana / copilot-bridge

Kuenoz / pytorch_training_optimization_using_tensordict_memory_mapping

kuttivicky / Waymo-e2e-profiler

TravisLeeTS / llm-scheduler-sim

forgottenforge / levi-edge

JonSnow1807 / Fused-LayerNorm-CUDA-Operator

tukue / aws-finops-container-optimization

intelav / GeoAccel-AI

anurag2796 / hybrid-ml-scheduler

JeyaPrakashI / Cloud-Commitment-ROI-Simulator

Improve this page

Add this topic to your repo