In this paper we consider several variants of the standard successive-approximation method for (semi) Markov decision processes with unbounded rewards. Wessels and van Nunen have shown that a class of variants can be generated by randomized stopping times, where the probability of "stopping" the process at timen is independent of the actions taken up to timen. In this paper we allow the stopping time to depend on the actions as well as the states. This makes it possible to extend the class of solution techniques in such a way that properties of the reward and transition structure depending on the actions can be exploited in the development of appropriate successive-approximation methods. For a special actions-dependent stopping time the corresponding algorithm possesses the so-called "equal-row-sum" property, which can be used, for example, to transform semi-Markov decision processes into ordinary Markov decision processes. Moreover, the equal-row-sum transformation allows for good extrapolation to upper and lower bounds and elimination of non-optimal actions. In dieser Arbeit betrachten wir mehrere Varianten der Methode der sukzessiven Approximation bei (semi-) Markoffschen Enscheidungsprozessen mit unbeschrankten Ertragen. Wessels und van Nunen haben gezeigt, daβ man eine Klasse von Verfahren mit Hilfe von randomisierten Stoppzeiten erzeugen kann, wobei die Wahrscheinlichkeit, den Prozeβ zur Zeitn zu stoppen, unabhangig von den Aktionen bis zur Zeitn ist. In der vorliegenden Arbeit durfen die Stoppzeiten von den Aktionen und den Zustanden abhangen. Dadurch ist es moglich, die Klasse der Losungsverfahren so zu erweitern, daβ Eigenschaften der Ertrage und der Ubergangsstruktur, die von den Aktionen abhangen, bei der Entwicklung von Verfahren der sukzessiven Approximation berucksichtigt werden konnen. Fur eine spezielle aktions-abhangige Stoppzeit besitzt der zugehorige Algorithmus die sogenannte "equal-row-sum" Eigenschaft, die beispielsweise Anwendung findet bei der Transformation eines semi-markoffschen Entscheidungsprozesses in einen gewohnlichen Markoffschen Entscheidungsprozeβ. Daruberhinaus gestattet die equal-row-sum Eigenschaft die Konstruktion guter unterer und oberer Schranken der Wertfunktion, sowie die Elimination nicht optimaler Aktionen.