中山大学智能化软件研发组 SYSUSELab

Research

本页展示了实验室当前的研究工作，我们的研究方向聚焦于软件工程（SE）与人工智能（AI）交叉领域，主要探索AI4SE（AI赋能软件工程）和SE4AI（软件工程赋能AI）的前沿问题。具体研究包括：基于大模型的智能化开发与维护、软件开发知识图谱、大模型可信评测、可信代码大模型等。致力于利用大规模语言模型（LLM）、知识图谱（KG）等先进AI技术，解决软件工程中的核心挑战，并应对AI应用中的软件工程和系统工程问题。

相关链接请参考：

GitHub: https://github.com/SYSUSELab/
Hugging Face: https://huggingface.co/SYSUSELab

Highlighted

citation image

[no title info]

[no publisher info] · [no date info] · [no id info]

All

2026

FeedbackEval: A Benchmark for Evaluating Large Language Models in Feedback-Driven Code Repair Tasks

FeedbackEval: A Benchmark for Evaluating Large Language Models in Feedback-Driven Code Repair Tasks

Dekun Dai, MingWei Liu, Anji Li, Jialun Cao, Yanlin Wang, Chong Wang, Xin Peng, Zibin Zheng

arXiv · 27 Feb 2026 · arxiv:2504.06939

本文提出了 FeedbackEval，一个用于在反馈驱动的代码修复场景下评估大型语言模型的基准测试。

feedback-driven-code-repair large-language-models benchmark

Towards Better Code Generation: Adaptive Decoding with Uncertainty Guidance

Towards Better Code Generation: Adaptive Decoding with Uncertainty Guidance

Kaifeng He, Mingwei Liu, Chong Wang, Zike Li, Yanlin Wang, Xin Peng, Zibin Zheng

arXiv · 26 Feb 2026 · arxiv:2506.08980

本文介绍了 AdaDec，一个用于大型语言模型（LLMs）代码生成的、由不确定性引导的自适应解码框架。

code-generation adaptive-strategy language-model

KTester: Leveraging Domain and Testing Knowledge for More Effective LLM-based Test Generation

KTester: Leveraging Domain and Testing Knowledge for More Effective LLM-based Test Generation

Anji Li, Mingwei Liu, Zhenxi Chen, Zheng Pei, Zike Li, Dekun Dai, Yanlin Wang, Zibin Zheng

arXiv · 09 Feb 2026 · arxiv:2511.14224

本文介绍了 KTester，一种将项目和测试知识注入到基于大语言模型的单元测试生成中的方法。

test-generation unit-testing large-language-models

2025

Evolving Triple Knowledge-Augmented LLMs for Code Translation in Repository Context

Evolving Triple Knowledge-Augmented LLMs for Code Translation in Repository Context

Guangsheng Ou, Mingwei Liu, Yuxuan Chen, Xueying Du, Shengbo Wang, Zekai Zhang, Xin Peng, Zibin Zheng

arXiv · 25 Nov 2025 · arxiv:2503.18305

本文提出了 K3Trans 模型，一种利用三重知识增强的大语言模型，用于在代码仓库上下文中进行代码翻译。

Code (Coming Soon)

code-translation knowledge-driven self-evolving

RustRepoTrans: Repository-level Code Translation Benchmark Targeting Rust

RustRepoTrans: Repository-level Code Translation Benchmark Targeting Rust

Guangsheng Ou, Mingwei Liu, Yuxuan Chen, Yanlin Wang, Xin Peng, Zibin Zheng

arXiv · 20 Oct 2025 · arxiv:2411.13990

本文提出了一个针对 Rust 语言的仓库级代码翻译基准测试，关注增量翻译和仓库级上下文。

code-translation llm-evaluation incremental-translation repository-level-context

EvolMathEval: Towards Evolvable Benchmarks for Mathematical Reasoning via Evolutionary Testing

EvolMathEval: Towards Evolvable Benchmarks for Mathematical Reasoning via Evolutionary Testing

Shengbo Wang, Mingwei Liu, Zike Li, Anji Li, Yanlin Wang, Xin Peng, Zibin Zheng

arXiv · 07 Oct 2025 · arxiv:2508.13003

本文介绍了 EvolMathEval，一个通过演化测试（Evolutionary Testing）为大模型的数学推理能力构建可演化基准测试的方法。

math-benchmark evolutionary-testing

Are Decoder-Only Large Language Models the Silver Bullet for Code Search

Are Decoder-Only Large Language Models the Silver Bullet for Code Search?

Yuxuan Chen, Mingwei Liu, Guangsheng Ou, Anji Li, Dekun Dai, Yanlin Wang, Zibin Zheng

arXiv · 03 Sep 2025 · arxiv:2410.22240

本文探讨了仅解码器（Decoder-Only）架构的大语言模型在代码搜索任务中的有效性及其是否为终极解决方案。

Code (Not Available)

code-search decoder-only-llm fine-tuning