capella
/
RedCore


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504
							/*
Bullet Continuous Collision Detection and Physics Library
Copyright (c) 2003-2013 Erwin Coumans  http://bulletphysics.org

This software is provided 'as-is', without any express or implied warranty.
In no event will the authors be held liable for any damages arising from the use of this software.
Permission is granted to anyone to use this software for any purpose, 
including commercial applications, and to alter it and redistribute it freely, 
subject to the following restrictions:

1. The origin of this software must not be misrepresented; you must not claim that you wrote the original software. If you use this software in a product, an acknowledgment in the product documentation would be appreciated but is not required.
2. Altered source versions must be plainly marked as such, and must not be misrepresented as being the original software.
3. This notice may not be removed or altered from any source distribution.
*/
///original version written by Erwin Coumans, October 2013

#ifndef BT_MATRIX_X_H
#define BT_MATRIX_X_H

#include "bullet/LinearMath/btQuickprof.h"
#include "bullet/LinearMath/btAlignedObjectArray.h"

class btIntSortPredicate
{
	public:
		bool operator() ( const int& a, const int& b ) const
		{
			 return a < b;
		}
};


template <typename T> 
struct btMatrixX
{
	int m_rows;
	int m_cols;
	int m_operations;
	int m_resizeOperations;
	int m_setElemOperations;

	btAlignedObjectArray<T>	m_storage;
	btAlignedObjectArray< btAlignedObjectArray<int> > m_rowNonZeroElements1;
	btAlignedObjectArray< btAlignedObjectArray<int> > m_colNonZeroElements;

	T* getBufferPointerWritable() 
	{
		return m_storage.size() ? &m_storage[0] : 0;
	}

	const T* getBufferPointer() const
	{
		return m_storage.size() ? &m_storage[0] : 0;
	}
	btMatrixX()
		:m_rows(0),
		m_cols(0),
		m_operations(0),
		m_resizeOperations(0),
		m_setElemOperations(0)
	{
	}
	btMatrixX(int rows,int cols)
		:m_rows(rows),
		m_cols(cols),
		m_operations(0),
		m_resizeOperations(0),
		m_setElemOperations(0)
	{
		resize(rows,cols);
	}
	void resize(int rows, int cols)
	{
		m_resizeOperations++;
		m_rows = rows;
		m_cols = cols;
		{
			BT_PROFILE("m_storage.resize");
			m_storage.resize(rows*cols);
		}
		clearSparseInfo();
	}
	int cols() const
	{
		return m_cols;
	}
	int rows() const
	{
		return m_rows;
	}
	///we don't want this read/write operator(), because we cannot keep track of non-zero elements, use setElem instead
	/*T& operator() (int row,int col)
	{
		return m_storage[col*m_rows+row];
	}
	*/

	void addElem(int row,int col, T val)
	{
		if (val)
		{
			if (m_storage[col+row*m_cols]==0.f)
			{
				setElem(row,col,val);
			} else
			{
				m_storage[row*m_cols+col] += val;
			}
		}
	}
	
	void copyLowerToUpperTriangle()
	{
		int count=0;
		for (int row=0;row<m_rowNonZeroElements1.size();row++)
		{
			for (int j=0;j<m_rowNonZeroElements1[row].size();j++)
			{
				int col = m_rowNonZeroElements1[row][j];
				setElem(col,row, (*this)(row,col));
				count++;

			}
		}
		//printf("copyLowerToUpperTriangle copied %d elements out of %dx%d=%d\n", count,rows(),cols(),cols()*rows());
	}
	void setElem(int row,int col, T val)
	{
		m_setElemOperations++;
		if (val)
		{
			if (m_storage[col+row*m_cols]==0.f)
			{
				m_rowNonZeroElements1[row].push_back(col);
				m_colNonZeroElements[col].push_back(row);
			}
			m_storage[row*m_cols+col] = val;
		}
	}
	const T& operator() (int row,int col) const
	{
		return m_storage[col+row*m_cols];
	}

	void clearSparseInfo()
	{
		BT_PROFILE("clearSparseInfo=0");
		m_rowNonZeroElements1.resize(m_rows);
		m_colNonZeroElements.resize(m_cols);
		for (int i=0;i<m_rows;i++)
			m_rowNonZeroElements1[i].resize(0);
		for (int j=0;j<m_cols;j++)
			m_colNonZeroElements[j].resize(0);
	}

	void setZero()
	{
		{
			BT_PROFILE("storage=0");
			btSetZero(&m_storage[0],m_storage.size());
			//memset(&m_storage[0],0,sizeof(T)*m_storage.size());
			//for (int i=0;i<m_storage.size();i++)
	//			m_storage[i]=0;
		}
		{
			BT_PROFILE("clearSparseInfo=0");
			clearSparseInfo();
		}
	}

	void	printMatrix(const char* msg)
	{
		printf("%s ---------------------\n",msg);
		for (int i=0;i<rows();i++)
		{
			printf("\n");
			for (int j=0;j<cols();j++)
			{
				printf("%2.1f\t",(*this)(i,j));
			}
		}
		printf("\n---------------------\n");

	}
	void	printNumZeros(const char* msg)
	{
		printf("%s: ",msg);
		int numZeros = 0;
		for (int i=0;i<m_storage.size();i++)
			if (m_storage[i]==0)
				numZeros++;
		int total = m_cols*m_rows;
		int computedNonZero = total-numZeros;
		int nonZero = 0;
		for (int i=0;i<m_colNonZeroElements.size();i++)
			nonZero += m_colNonZeroElements[i].size();
		btAssert(computedNonZero==nonZero);
		if(computedNonZero!=nonZero)
		{
			printf("Error: computedNonZero=%d, but nonZero=%d\n",computedNonZero,nonZero);
		}
		//printf("%d numZeros out of %d (%f)\n",numZeros,m_cols*m_rows,numZeros/(m_cols*m_rows));
		printf("total %d, %d rows, %d cols, %d non-zeros (%f %)\n", total, rows(),cols(), nonZero,100.f*(T)nonZero/T(total));
	}
	/*
	void rowComputeNonZeroElements()
	{
		m_rowNonZeroElements1.resize(rows());
		for (int i=0;i<rows();i++)
		{
			m_rowNonZeroElements1[i].resize(0);
			for (int j=0;j<cols();j++)
			{
				if ((*this)(i,j)!=0.f)
				{
					m_rowNonZeroElements1[i].push_back(j);
				}
			}
		}
	}
	*/
	btMatrixX transpose() const
	{
		//transpose is optimized for sparse matrices
		btMatrixX tr(m_cols,m_rows);
		tr.setZero();
#if 0
		for (int i=0;i<m_cols;i++)
			for (int j=0;j<m_rows;j++)
			{
				T v = (*this)(j,i);
				if (v)
				{
					tr.setElem(i,j,v);
				}
			}
#else		
		for (int i=0;i<m_colNonZeroElements.size();i++)
			for (int h=0;h<m_colNonZeroElements[i].size();h++)
			{
				int j = m_colNonZeroElements[i][h];
				T v = (*this)(j,i);
				tr.setElem(i,j,v);
			}
#endif
		return tr;
	}

	void sortRowIndexArrays()
	{
		for (int i=0;i<m_rowNonZeroElements1[i].size();i++)
		{
			m_rowNonZeroElements1[i].quickSort(btIntSortPredicate());
		}
	}

	void sortColIndexArrays()
	{
		for (int i=0;i<m_colNonZeroElements[i].size();i++)
		{
			m_colNonZeroElements[i].quickSort(btIntSortPredicate());
		}
	}

	btMatrixX operator*(const btMatrixX& other)
	{
		//btMatrixX*btMatrixX implementation, optimized for sparse matrices
		btAssert(cols() == other.rows());

		btMatrixX res(rows(),other.cols());
		res.setZero();
//		BT_PROFILE("btMatrixX mul");
		for (int j=0; j < res.cols(); ++j)
		{
			//int numZero=other.m_colNonZeroElements[j].size();
			//if (numZero)
			{
				for (int i=0; i < res.rows(); ++i)
				//for (int g = 0;g<m_colNonZeroElements[j].size();g++)
				{
					T dotProd=0;
					T dotProd2=0;
					int waste=0,waste2=0;

					bool doubleWalk = false;
					if (doubleWalk)
					{
						int numRows = m_rowNonZeroElements1[i].size();
						int numOtherCols = other.m_colNonZeroElements[j].size();
						for (int ii=0;ii<numRows;ii++)
						{
							int vThis=m_rowNonZeroElements1[i][ii];
						}

						for (int ii=0;ii<numOtherCols;ii++)
						{
							int vOther = other.m_colNonZeroElements[j][ii];
						}


						int indexRow = 0;
						int indexOtherCol = 0;
						while (indexRow < numRows && indexOtherCol < numOtherCols)
						{
							int vThis=m_rowNonZeroElements1[i][indexRow];
							int vOther = other.m_colNonZeroElements[j][indexOtherCol];
							if (vOther==vThis)
							{
								dotProd += (*this)(i,vThis) * other(vThis,j);
							}
							if (vThis<vOther)
							{
								indexRow++;
							} else
							{
								indexOtherCol++;
							}
						}

					} else
					{
						bool useOtherCol = true;
						if (other.m_colNonZeroElements[j].size() <m_rowNonZeroElements1[i].size())
						{
						useOtherCol=true;
						}
						if (!useOtherCol )
						{
							for (int q=0;q<other.m_colNonZeroElements[j].size();q++)
							{
								int v = other.m_colNonZeroElements[j][q];
								T w = (*this)(i,v);
								if (w!=0.f)
								{
									dotProd+=w*other(v,j);
								}
						
							}
						}
						else
						{
							for (int q=0;q<m_rowNonZeroElements1[i].size();q++)
							{
								int v=m_rowNonZeroElements1[i][q];
								T w = (*this)(i,v);
								if (other(v,j)!=0.f)
								{
									dotProd+=w*other(v,j);	
								}
						
							}
						}
					}
					if (dotProd)
						res.setElem(i,j,dotProd);
				}
			}
		}
		return res;
	}

	// this assumes the 4th and 8th rows of B and C are zero.
	void multiplyAdd2_p8r (const btScalar *B, const btScalar *C,  int numRows,  int numRowsOther ,int row, int col)
	{
		const btScalar *bb = B;
		for ( int i = 0;i<numRows;i++)
		{
			const btScalar *cc = C;
			for ( int j = 0;j<numRowsOther;j++)
			{
				btScalar sum;
				sum  = bb[0]*cc[0];
				sum += bb[1]*cc[1];
				sum += bb[2]*cc[2];
				sum += bb[4]*cc[4];
				sum += bb[5]*cc[5];
				sum += bb[6]*cc[6];
				addElem(row+i,col+j,sum);
				cc += 8;
			}
			bb += 8;
		}
	}

	void multiply2_p8r (const btScalar *B, const btScalar *C,  int numRows,  int numRowsOther, int row, int col)
	{
		btAssert (numRows>0 && numRowsOther>0 && B && C);
		const btScalar *bb = B;
		for ( int i = 0;i<numRows;i++)
		{
			const btScalar *cc = C;
			for ( int j = 0;j<numRowsOther;j++)
			{
				btScalar sum;
				sum  = bb[0]*cc[0];
				sum += bb[1]*cc[1];
				sum += bb[2]*cc[2];
				sum += bb[4]*cc[4];
				sum += bb[5]*cc[5];
				sum += bb[6]*cc[6];
				setElem(row+i,col+j,sum);
				cc += 8;
			}
			bb += 8;
		}
	}

};

template <typename T> 
struct btVectorX
{
	btAlignedObjectArray<T>	m_storage;

	btVectorX()
	{
	}
	btVectorX(int numRows)
	{
		m_storage.resize(numRows);
	}

	void resize(int rows)
	{
		m_storage.resize(rows);
	}
	int cols() const
	{
		return 1;
	}
	int rows() const
	{
		return m_storage.size();
	}
	int size() const
	{
		return rows();
	}
	void	setZero()
	{
	//	for (int i=0;i<m_storage.size();i++)
	//		m_storage[i]=0;
		//memset(&m_storage[0],0,sizeof(T)*m_storage.size());
		btSetZero(&m_storage[0],m_storage.size());
	}
	const T& operator[] (int index) const
	{
		return m_storage[index];
	}

	T& operator[] (int index)
	{
		return m_storage[index];
	}

	T* getBufferPointerWritable() 
	{
		return m_storage.size() ? &m_storage[0] : 0;
	}

	const T* getBufferPointer() const
	{
		return m_storage.size() ? &m_storage[0] : 0;
	}

};
/*
template <typename T> 
void setElem(btMatrixX<T>& mat, int row, int col, T val)
{
	mat.setElem(row,col,val);
}
*/


typedef btMatrixX<float> btMatrixXf;
typedef btVectorX<float> btVectorXf;

typedef btMatrixX<double> btMatrixXd;
typedef btVectorX<double> btVectorXd;


inline void setElem(btMatrixXd& mat, int row, int col, double val)
{
	mat.setElem(row,col,val);
}

inline void setElem(btMatrixXf& mat, int row, int col, float val)
{
	mat.setElem(row,col,val);
}

#ifdef BT_USE_DOUBLE_PRECISION
	#define btVectorXu btVectorXd
	#define btMatrixXu btMatrixXd
#else
	#define btVectorXu btVectorXf
	#define btMatrixXu btMatrixXf
#endif //BT_USE_DOUBLE_PRECISION


#endif//BT_MATRIX_H_H