Alex's picture

Alex

M0nteCarl0

·

/M0nteCarl0

AI & ML interests

NLP, CV, information security ML, FinTech ML

Recent Activity

updated a collection about 21 hours ago

upvoted a collection about 21 hours ago

upvoted a paper about 21 hours ago

TriAttention: Efficient Long Reasoning with Trigonometric KV Compression

View all activity

Organizations

None yet

updated a collection about 21 hours ago

llm attentions

3 items • Updated about 21 hours ago

upvoted a collection about 21 hours ago

Attention

18 items • Updated about 22 hours ago • 1

upvoted a paper about 21 hours ago

TriAttention: Efficient Long Reasoning with Trigonometric KV Compression

Paper • 2604.04921 • Published 2 days ago • 73

liked a model 2 days ago

RuneXX/LTX-2.3-Workflows

Image-to-Video • Updated 1 day ago • 342

updated a collection 6 days ago

Voice cloning & TTS

2 items • Updated 6 days ago

upvoted a paper 6 days ago

Sommelier: Scalable Open Multi-turn Audio Pre-processing for Full-duplex Speech Language Models

Paper • 2603.25750 • Published 19 days ago • 35

updated a collection 6 days ago

Diffusion models

6 items • Updated 6 days ago

upvoted a paper 6 days ago

MMFace-DiT: A Dual-Stream Diffusion Transformer for High-Fidelity Multimodal Face Generation

Paper • 2603.29029 • Published 8 days ago • 13

liked a model 7 days ago

microsoft/harrier-oss-v1-270m

Feature Extraction • 0.3B • Updated 9 days ago • 13k • • 129

updated a collection 8 days ago

Diffusion models

6 items • Updated 6 days ago

upvoted a paper 8 days ago

DreamLite: A Lightweight On-Device Unified Model for Image Generation and Editing

Paper • 2603.28713 • Published 9 days ago • 19

liked a model 10 days ago

ibm-granite/granite-4.0-3b-vision

Image-Text-to-Text • 4B • Updated 8 days ago • 8.01k • 85

liked a model 12 days ago

chromadb/context-1

Text Generation • 21B • Updated 9 days ago • 4.05k • 377

updated a collection 12 days ago

llm attentions

3 items • Updated about 21 hours ago

upvoted a paper 12 days ago

MSA: Memory Sparse Attention for Efficient End-to-End Memory Model Scaling to 100M Tokens

Paper • 2603.23516 • Published Mar 6 • 45

liked a model 13 days ago

mistralai/Voxtral-4B-TTS-2603

Text-to-Speech • Updated 8 days ago • 6.19k • 691

upvoted a paper 14 days ago

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Paper • 2603.20278 • Published 21 days ago • 92

liked 2 models 16 days ago

JiongzeYu/SparkVSR

Updated 4 days ago • 694 • 56

HauhauCS/Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive

Image-Text-to-Text • 35B • Updated 3 days ago • 815k • 1.22k

updated a collection 16 days ago

Rag

4 items • Updated 16 days ago