Finite-sum Optimization Research Articles

The nonconvex and nonsmooth finite-sum optimization problem with linear constraint has attracted much attention in the fields of artificial intelligence, computer, and mathematics, due to its wide applications in machine learning and the lack of efficient algorithms with convincing convergence theories. A popular approach to solve it is the stochastic Alternating Direction Method of Multipliers (ADMM), but most stochastic ADMM-type methods focus on convex models. In addition, the variance reduction (VR) and acceleration techniques are useful tools in the development of stochastic methods due to their simplicity and practicability in providing acceleration characteristics of various machine learning models. However, it remains unclear whether accelerated SVRG-ADMM algorithm (ASVRG-ADMM), which extends SVRG-ADMM by incorporating momentum techniques, exhibits a comparable acceleration characteristic or convergence rate in the nonconvex setting. To fill this gap, we consider a general nonconvex nonsmooth optimization problem and study the convergence of ASVRG-ADMM. By utilizing a well-defined potential energy function, we establish its sublinear convergence rate O(1/T), where T denotes the iteration number. Furthermore, under the additional Kurdyka–Lojasiewicz (KL) property which is less stringent than the frequently used conditions for showcasing linear convergence rates, such as strong convexity, we show that the ASVRG-ADMM sequence almost surely has a finite length and converges to a stationary solution with a linear convergence rate. Several experiments on solving the graph-guided fused lasso problem and regularized logistic regression problem validate that the proposed ASVRG-ADMM performs better than the state-of-the-art methods.

Read full abstract

Distributed stochastic optimization, arising in the crossing and integration of traditional stochastic optimization, distributed computing and storage, and network science, has advantages of high efficiency and a low per-iteration computational complexity in resolving large-scale optimization problems. This paper concentrates on resolving a large-scale convex finite-sum optimization problem in a multi-agent system over unbalanced directed networks. To tackle this problem in an efficient way, a distributed consensus optimization algorithm, adopting the push-sum technique and a distributed loopless stochastic variance-reduced gradient (LSVRG) method with uncoordinated triggered probabilities, is developed and named Push-LSVRG-UP. Each agent under this algorithmic framework performs only local computation and communicates only with its neighbors without leaking their private information. The convergence analysis of Push-LSVRG-UP is relied on analyzing the contraction relationships between four error terms associated with the multi-agent system. Theoretical results provide an explicit feasible range of the constant step-size, a linear convergence rate, and an iteration complexity of Push-LSVRG-UP when achieving the globally optimal solution. It is shown that Push-LSVRG-UP achieves the superior characteristics of accelerated linear convergence, fewer storage costs, and a lower per-iteration computational complexity than most existing works. Meanwhile, the introduction of an uncoordinated probabilistic triggered mechanism allows Push-LSVRG-UP to facilitate the independence and flexibility of agents in computing local batch gradients. In simulations, the practicability and improved performance of Push-LSVRG-UP are manifested via resolving two distributed learning problems based on real-world datasets.

Read full abstract

Finite-sum Optimization Research Articles

Articles published on Finite-sum Optimization

Complexity of Finite-Sum Optimization with Nonsmooth Composite Functions and Non-Lipschitz Regularization

Shuffling-type gradient method with bandwidth-based step sizes for finite-sum optimization

Incremental Quasi-Newton Methods with Faster Superlinear Convergence Rates

Distributed Stochastic Proximal Algorithm With Random Reshuffling for Nonsmooth Finite-Sum Optimization.

Subsampled cubic regularization method for finite-sum minimization

An accelerated stochastic ADMM for nonconvex and nonsmooth finite-sum optimization

Incremental quasi-Newton algorithms for solving a nonconvex, nonsmooth, finite-sum optimization problem

Distributed Stochastic Gradient Tracking Algorithm With Variance Reduction for Non-Convex Optimization.

Convergence analysis of a subsampled Levenberg-Marquardt algorithm

An Adaptive Variance Reduction Zeroth-Order Algorithm for Finite-Sum Optimization

Push-LSVRG-UP: Distributed Stochastic Optimization Over Unbalanced Directed Networks With Uncoordinated Triggered Probabilities

DSAG: A Mixed Synchronous-Asynchronous Iterative Method for Straggler-Resilient Learning

Variance-Reduced Shuffling Gradient Descent With Momentum for Finite-Sum Minimization

DESTRESS: Computation-Optimal and Communication-Efficient Decentralized Nonconvex Finite-Sum Optimization

Efficient Decentralized Stochastic Gradient Descent Method for Nonconvex Finite-Sum Optimization Problems

Fast Decentralized Nonconvex Finite-Sum Optimization with Recursive Variance Reduction

Trust-region algorithms: Probabilistic complexity and intrinsic noise with applications to subsampling techniques

FedSVRG Based Communication Efficient Scheme for Federated Learning in MEC Networks

An Optimal Algorithm for Decentralized Finite-Sum Optimization

An investigation of Newton-Sketch and subsampled Newton methods

Lead the way for us

Editage

Paperpal

R Discovery

Mind the Graph

Finite-sum Optimization Research Articles

Articles published on Finite-sum Optimization

Complexity of Finite-Sum Optimization with Nonsmooth Composite Functions and Non-Lipschitz Regularization

Shuffling-type gradient method with bandwidth-based step sizes for finite-sum optimization

Incremental Quasi-Newton Methods with Faster Superlinear Convergence Rates

Distributed Stochastic Proximal Algorithm With Random Reshuffling for Nonsmooth Finite-Sum Optimization.

Subsampled cubic regularization method for finite-sum minimization

An accelerated stochastic ADMM for nonconvex and nonsmooth finite-sum optimization

Incremental quasi-Newton algorithms for solving a nonconvex, nonsmooth, finite-sum optimization problem

Distributed Stochastic Gradient Tracking Algorithm With Variance Reduction for Non-Convex Optimization.

Convergence analysis of a subsampled Levenberg-Marquardt algorithm

An Adaptive Variance Reduction Zeroth-Order Algorithm for Finite-Sum Optimization

Push-LSVRG-UP: Distributed Stochastic Optimization Over Unbalanced Directed Networks With Uncoordinated Triggered Probabilities

DSAG: A Mixed Synchronous-Asynchronous Iterative Method for Straggler-Resilient Learning

Variance-Reduced Shuffling Gradient Descent With Momentum for Finite-Sum Minimization

DESTRESS: Computation-Optimal and Communication-Efficient Decentralized Nonconvex Finite-Sum Optimization

Efficient Decentralized Stochastic Gradient Descent Method for Nonconvex Finite-Sum Optimization Problems

Fast Decentralized Nonconvex Finite-Sum Optimization with Recursive Variance Reduction

Trust-region algorithms: Probabilistic complexity and intrinsic noise with applications to subsampling techniques

FedSVRG Based Communication Efficient Scheme for Federated Learning in MEC Networks

An Optimal Algorithm for Decentralized Finite-Sum Optimization

An investigation of Newton-Sketch and subsampled Newton methods